|
|
搜索引擎解析內核
內置分詞/索引/檢索引擎
軟件內置有熊貓獨立研發的分詞索引檢索引擎,用于文章的分詞、文章內容相似度的分析匹配,摘要自動生成等應用。性能強悍,內存占用小,效率極高。
仿瀏覽器解析
熊貓采集軟件對采集網頁實現仿瀏覽器解析,在此解析基礎上再做其它深度分析和加工。以后版本的熊貓,在完善此項技術后,軟件的功能和功效應該會得到顯著提高。
視覺模擬技術
熊貓采集軟件會模擬人的視覺來分析網頁,在此基礎上利用參考(模板)頁面實現采集匹配工作。
網站頁面邏輯關系分析技術
對模板頁面的容錯能力
高效的解析、采集速度