網站管理員從互聯網中收集各類圖片、笑話、新聞、技術等各類信息,然後分類、編輯,發布到自己的網站系統中。網站管理員壹般通過搜索引擎搜索各類關鍵字獲取目標網址,然後再提取網頁中的內容。關鍵字的組織決定獲取內容的準確性和數量。由於內容來自不同的網站,所以提取內容的方法也各不相同。對於某壹類的信息,發布到網站系統的數據結構是相同的。
網站管理員對站內進行搜索,將相關的內容在首頁上進行編排和索引。
企業從互聯網上搜索email和電話號碼,並且能夠查看該信息的相關信息,以便了解該對象的基本情況。企業希望能夠搜索某壹類別的客戶信息,如這個客戶屬於女性,年齡為20到30歲等。並且能夠將采集到的對象信息保存到企業內部的客戶管理系統中。
企業需要了解某壹產品的信息,希望得到該類產品的報價、廠商等,以及這些信息的對比情況。並且能夠得到報價、廠商的近壹步信息。這些信息希望能夠保存到企業的內部的ERP系統或其它系統中。