一、產品概述:
SMA-1108文檔內容檢索系統是一款專業的文檔內容數據檢查系統,對Windows系統內部數據進行無死角審查,對海量文檔數據進行索引,從而實現海量數據秒級搜索,支持所有Office類文檔數據、圖片文字內容搜索、壓縮文件內文檔內容搜索、郵件文件內容搜索、郵件附件搜索等,同時支持各種音頻文件、視頻文件內語音內容的識別搜索、視頻文件內文字內容搜索,支持文檔內容預覽、導出、打開功能。支持精準關鍵詞搜索和模糊搜索。支持違規檢測,一鍵快速對內容進行快速審查。
二、功能特點:
1.支持圖片內文字內容搜索,JPEG、JPG、PNG、BMP、GIF、TIFF
2.支持壓縮包內文檔,文檔內容搜索,ZIP、RAR、7Z、TAR、BZIP2、GZIP、LZIP。
3.支持辦公文檔內容搜索,DOC、DOCX、XLS、XLSX、PDF。
4.純文本文檔:TXT、XML、LOG、HTML。
5.支持音頻文件,語音內容搜索,MP3、WAV、RM、FLAV、WMA。
6.支持視頻文件,語音內容搜索,MP4、MOV、AVI、3GP。
7.支持視頻文件,視頻圖像上文字搜索,MP4、MOV、AVI、3GP。
8.支持視頻文件逐幀解析、關鍵幀解析。
9.支持EML、OST、PST等郵件文件內容搜索。
10.支持郵件附件搜索。
11.支持郵件壓縮包附件解壓內部文件搜索,可無限遞歸解壓。
12.支持自定義其它后綴名文件內容搜索。
13.支持文本類文件命中關鍵字在文檔中位置高亮顯示,并記錄偏移位置。
14.支持音頻文件命中關鍵字在音頻文件語音文字中高亮顯示,并記錄偏移位置。
15.支持視頻文件命中關鍵字在音頻文件語音文字中高亮顯示,并記錄偏移位置。
16.支持視頻文件中文本內容在視頻文件中位于第幾分幾秒位置記錄,并直接打開截圖。
17.支持圖片OCR直接提取圖片文本。
18.支持違規檢測敏感詞級別定義。
19.支持多關鍵詞搜索,通過’;’號隔開。
20.支持文檔中命中關鍵詞展示。
21.支持歷史記錄導入歷史索引庫,無需二次加載。
22.支持敏感詞違規檢測,可根據詞匯保密級別設置。
23.采用最新索引算法,對建完索引結果,TB級數據,實現秒級搜索,快速排查。
24.支持排查結果數據統計,快速導出審查結果報告。
25.支持文檔預覽,直接通過軟件預覽文檔內容。
26.支持數據精準搜索算法。
27.支持數據模糊搜索算法。