您好,游客 登录 注册 站内搜索
背景颜色:
阅读论文

基于RSS源的搜索引擎概述与实现方法

来源:奥博平台  作者:刘聪 [字体: ]

基于RSS源的搜索引擎概述与实现方法

一、技术背景
  搜索引擎为网络信息检索提供了巨大的方便,使我們可以直接利用检索语法来获取自己想要的信息。但是随着互联网的发展与信息爆炸式增长,传统的搜索引擎逐渐暴露出更新速度慢、收录不完整等缺点,不能满足用户多样化、纯净化的需求,RSS搜索引擎应运而生。
  顾名思义,RSS搜索引擎是对RSS信息的再次整合,用户可以通过关键字搜索检索自己需要信息。相比于传统搜索引擎,RSS源搜索本文由论文联盟http://www.LWlM.cOm收集整理引擎能够满足用户的时效性需求、信息定位更加精准、信息搜索更加全面以及更小的信息冗余和更高的搜索效率。
  二、实现思路
  (一)数据获取
  RSS采用XML(可扩展标记语言)格式,使用特定标签将信息写入RSS。虽然不同的RSS数据源有自己的特点,但标签取名和标签数量基本一致。RSS信息中一般含有标题、摘要、链接和时间,部分RSS还有图片和正文等信息。
  为减少工作量和开发难度,获取数据一般采用专用的RSS解析器,主流的解析器有RSSLibJ、Flock 、Informa 、ROME等,其功能大同小异。笔者以ROME为例,通过向解析器提供RSS地址,强大的解析器提取出

欢迎浏览更多奥博平台计算机文搜索研究论文文章
收藏 & 分享 推荐 打印 | 录入:pyuanmm

本文评论   查看全部评论 (0)
表情: 评论表情符号选择 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款