大数据学习13:MapReduce编程案例2(倒排索引,MRUnit)_大数据倒排索引案例结果-CSDN博客

网站介绍:文章浏览阅读199次。MapReduce编程案例2文档倒排算法简介Inverted Index(倒排索引)是目前几乎所有支持全文检索的搜索引擎都要依赖的一个数据结构。基于索引结构,给出一个词(term),能取得含有这个term的文档列表(the list of documents)Web Search中的问题主要分为三部分:crawling(gathering web content) ,网页爬虫,收集数据i..._大数据倒排索引案例结果