更新時間:2023-10-30 來源:黑馬程序員 瀏覽量:
(1)分布式的搜索引擎和數據分析引擎
搜索:百度,網站的站內搜索,IT系統的檢索數據分析:電商網站,最近7天牙膏這種商品銷量排名前10的商家有哪些;新聞網站,最近1個月訪問量排名前3的新聞版塊是哪些分布式,搜索,數據分析
(2)全文檢索,結構化檢索,數據分析
全文檢索:我想搜索商品名稱包含牙膏的商品,select * from products where product_name like "%牙膏%"結構化檢索:我想搜索商品分類為日化用品的商品都有哪些,select * from products where category_id='日化用品'部分匹配、自動完成、搜索糾錯、搜索推薦數據分析:我們分析每一個商品分類下有多少個商品,select category_id,count(*) from products group by category_id
(3)對海量數據進行近實時的處理
分布式:ES自動可以將海量數據分散到多臺服務器上去存儲和檢索海量數據的處理:分布式以后,就可以采用大量的服務器去存儲和檢索數據,自然而然就可以實現海量數據的。
處理了近實時:檢索個數據要花費1小時(這就不要近實時,離線批處理,batch-processing);在秒級別對數據進行搜索和分析跟分布式/海量數據相反的:lucene,單機應用,只能在單臺服務器上使用,最多只能處理單臺服務器可以處理的數據量。
Elasticsearch 是通過 Lucene 的倒排索引技術實現比關系型數據庫更快的過濾。特別是它對多條件的過濾支持非常好,比如年齡在 18 和 30 之間,性別為女性這樣的組合查詢。