-
- 素材大小:
- 2 MB
- 素材授权:
- 免费下载
- 素材格式:
- .ppt
- 素材上传:
- lipeier
- 上传时间:
- 2019-05-14
- 素材编号:
- 230937
- 素材类别:
- 课件PPT
-
素材预览
这是信息检索ppt格式课件,包括了Internet概述,网络信息资源,网络搜索引擎,常用搜索引擎,Internet相关的名词术语,网络信息资源的特点,网络信息资源检索的一般方法,网络信息资源的检索技术等内容,欢迎点击下载。
信息检索ppt格式课件是由红软PPT免费下载网推荐的一款课件PPT类型的PowerPoint.
第 二 章 网络信息检索 Internet 概述 网络信息资源 网络搜索引擎 常用搜索引擎 第一节 Internet概述 二、Internet相关的名词术语 1、网站(Web Site ) 指放置网页供用户登录浏览的计算机 2、网络通信协议 网络中互相通信的对等实体间交换信息时所遵守的规则的集合 OSI协议(Open system interconnection) TCP/IP协议 3、IP地址 (1)含义及作用 Internet为网络上的每个节点(主机、服务器、客户机、路由器等)确定了一个网络位置的唯一标识,即IP地址,以保证在分布于世界各地的计算机间准确地传输信息。 (2)IP地址的组成 IP地址是一个32位二进制数,按每8位换算为十进制数字,分为4段号码,每段号码的值为0~255,各段号码用小圆点“.”分隔。 如:211.64.132.86 每个IP地址由两个部分组成: 网络标识、主机标识 同一个物理网络上的所有主机用一个网络ID, 每一个主机各有一个唯一的主机ID与之对应 (3)IP地址的类型 A类网络地址:四段号码的第一段号码为网络ID号,其余三段号码为主机ID号。这类地址一般分给具有大量主机的大型网络使用。 B类网络地址:头两段号码为网络ID号,后两段为主机ID号。一般分给中等规模主机数的网络使用 C类网络地址:头三段为网络ID号,最后为当地号。一般分给小型局域网使用。 (4)IP 地址的分配方式 4、Internet域名地址 组成: 主机名.机构名.网络名.最高层域名 如:www.ouc.edu.cn 5、统一资源定位器(URL) 6、超文本(Hypertext) 某些字、符号或短语起着Hotlink作用的文本文件。当链接的内容同时含有文字、声音、图象、动画等时,就称为超媒体Hypermedia。 7、超文本标记语言(HTML) Hyper Text Markup Language,指WWW文件所采用的简单标记语言,可用来制作网页。 8、主页(Home Page) WWW服务器的入口html文件,常用于介绍服务器和运行该服务器单位的基本情况。 9、浏览器(Browser) 用HTML编写的脚本程序或者网页,其源代码都是纯文本,需要借助浏览器进行翻译,才能显示成图文并茂的网页。 客户端浏览程序可向服务器发送各种请求,并对从服务器发来的超文本信息和各种多媒体数据格式进行解释、显示和播放。 WWW 浏览器有几百种之多,目前使用最多的是美国Microsoft公司的IE ( Internet Explorer ),和美国Netscape 公司的Navigator。 浏览器的几种基本功能 检索查询 :利用超文本进行链接,通过HTTP协议,在任意WWW服务器上畅游。 文件服务:上载下载文件。 热表管理:记住刚刚访问过的网页,可在热表中切换。 主页建立:有网页制作功能。 提供其它Internet服务,如:FTP Gopher WAIS Telnet E-mail 等。 第二节 网络信息资源 一、网络信息资源的概念与特点 1、概念 是指将文字、图像、声音、动画等多种形式的信息数字化后存放在光磁等非印刷介质的载体中,并通过计算机网络通讯等方式进行传递的信息内容的集合。 2、网络信息资源的特点 载体形式虚拟性 存储方式多样性 传播方式交互性 存在状态无序性、不稳定性 信息价值差异性 二、网络信息资源检索的一般方法 1、浏览 随意浏览,记录网上期刊、数据库以及信息机构等有用信息的网站地址 2、通过网络资源指南查找 利用由专业人员开发出来的网络资源主题指南 3、利用网络信息检索工具查找 使用不同类型的网络检索工具,来查询不同类型的资源 三、网络信息资源的检索技术 1、分类目录检索 网络分类目录一般是人工建立的,类似于图书馆的目录,适合于主题较宽泛或要求较为简单的查询。Yahoo即属典型的分类目录检索工具。 2、关键词检索 指利用搜索索引查找Web页的方法。较适合于主题较为专指、细小或狭窄的查询。 四、网络信息资源的检索工具 1、网络信息检索工具的种类 2、超文本信息检索工具--WWW 主题分类检索 关键词检索 WWW或Web是World Wide Web的简称,中文称万维网,是Internet上一种高级的信息检索浏览方式。 第三节 网络搜索引擎 一、搜索引擎的概念和功能 二、搜索引擎的类型 三、搜索引擎的工作方式 四、搜索引擎的检索方法 五、搜索引擎的检索技巧 一、搜索引擎的概念和功能 1、搜索引擎的概念 WWW上的信息数以亿计,人们需要一种WWW信息发现系统,能自动地在网上漫游,并搜集它所能得到的信息,自动生成本地索引。 搜索引擎(Search Engine): 管理和检索网络信息资源的软件。 2、搜索引擎的功能 (1)收集信息建立索引数据库,并自动跟踪信息源的变动,不断更新索引记录,定期维护数据库。 (2)提供网络的导航与检索服务(最主要的功能) (3)提供其它多种信息服务 二、搜索引擎的类型 1、根据信息覆盖范围及适用用户群分 (1)综合搜索引擎 主要以Web网页和新闻组为搜索对象,信息覆盖范围广,适用用户广泛。如:Yahoo!、AltaVista、Infoseek等。 (2)专用搜索引擎 也称专题搜索引擎,针对特定用户群,可供查找某一特定领域的信息。如: Softseek提供软件查找,MapBlast查找地图信息 2、根据组织信息方式分类 (1) 目录式搜索引擎 提供等级式主题目录,用户通过主题目录的指引,逐层浏览信息,直到找到与自己需求相关的。适合希望了解某一方面或范围内信息但又没有明确搜索目的的用户使用。最具代表性的目录式搜索引擎是Yahoo!。 优点: 由于网络目录中的网页是由专家人工精选所得,因此有较高的查准率。 缺点:其查全率较低,搜索范围较窄。 (2)全文搜索引擎(索引式) 提供对关键词或自然语言的查询,用户在检索框中输入检索词或检索式,搜索引擎会返回一组指向相关站点的超链接。能够对网站的每个网页中的每个单字进行搜索的引擎。典型代表是AltaVista。 优点:查全率高,搜索范围较广 缺点:查准率低,缺乏清晰的层次结构,查询结果中重复链接较多。 (3)分类全文搜索引擎 通常是在分类的基础上再进一步进行全文检索。很多搜索引擎同时提供分类和主题两种方式的检索,以更好满足用户需求。 (4) 智能搜索引擎 具备符合用户实际需要的知识库,搜索时根据已有的知识库来理解检索词的意义并以此产生联想,从而找出相关网站或网页。同时,具有一定的推理能力,能根据知识库的知识,运用人工智能方法进行推理。 3、根据搜索范围分类 (1)独立搜索引擎 常规搜索引擎,建有自己的数据库,搜索时通常只能在自己搜集的信息或者数据库中查找用户所需信息。目前的WWW搜索引擎基本上属于此类,如Yahoo!、AltaVista、Lycos、Infoseek等。 缺点:查询范围有限,不能利用其它工具搜集信息。 (2)多元搜索引擎 也称元搜索引擎, 它本身并不搜集信息和数据,而是利用其它搜索工具(包括搜索引擎、数据库等)搜集信息,对结果简单合并和去重后返回给用户 。如:中文的万纬、搜星,英文的Metasearch、Digisearch、Cyber411、Metacrawler、Savvysearch、Profusion、IQ99等。 优点:可以获得更多、更全面的网址 缺点:查询时间较长 三、搜索引擎的工作方式 1、分类目录搜索 网络目录(Web Directory)即网络分类目录,提供Internet上其他站点的列表,通常按主题目录和子目录方式组织,可从分类目录顶层逐步向下浏览查询子目录。 网络目录采用传统的信息收集、分类、存储、组织和检索的方法,主要由专业人员对网站进行调查、筛选、分类、存储,手工建立关键字索引,再将索引信息存入相应的数据库中。网页内容丰富,学术性较强。 2、关键词搜索 用户访问搜索引擎的Web站点,在输入表格中输入感兴趣主题的关键词,站点检索以前建立的索引,返回包含这些关键字的站点列表。 信息的收集由搜索程序(如:robot、spider、harvest、pursuit等)自动完成。搜索程序定期在Internet上漫游,自动而系统地访问尽可能多的Web页面,对它们进行分析,建立起能够查找到相关单字的页面的URL地址的索引,并通过网页间的链接顺序搜索新的地址,当遇到新的网页时,就给该页做上索引,把它加到搜索引擎的数据库中,使得搜索引擎的数据库得以定期更新。 四、搜索引擎的检索方法 1、单词检索 2、词组检索:双引号,连符- 3、布尔逻辑检索:与、或、非 4、截词检索 5、限定检索:+、- 6、字母大小写 7、名词检索 8、检索结果显示 ①结果排序 ②显示格式 五、搜索引擎的检索技巧 1、选择合适的搜索引擎 2、确定搜索途径 3、选用搜索选项 4、选用准确的关键词 5、制定恰当的检索式 6、使用多种方法,优化检索结果 7、阅读引擎的帮助信息 第四节 常用搜索引擎 一、百度 http://www.baidu.com 1、概况 于1999年底成立于美国硅谷,是第一个为中国人写的商业化的互联网搜索引擎,信息量大,相关性好,刷新率高,速度快。支持中文GBK搜索,并实现了“动态网页”检索。 目前全国已有36家大型网站采用了百度引擎提供的核心技术,如新浪、搜狐、263在线,Tom.com,炎黄在线,Chinaren,赛迪网,清华大学,21CN,硅谷动力,PC-online,腾讯等。 3、检索算符 百度搜索支持多个检索词的逻辑组配检索 空格——“and”关系 字符“|”——并列(OR)关系 “-”——排除(NOT)关系 字符“()”——表达式是一个整体单元 在关键词前加“t:”——搜索网站标题 在关键词前加“u:”——搜索网站网址(URLs)。 4、检索结果 按结果质量排列相关的分类目录和网站。 质量越高,排列越靠前。 新闻检索的结果则是按日期序列,日期越新的新闻越靠前。 二、Google Google的功能 Google的特色 对WWW的链接结构进行分析和挖掘,不仅能够搜索关键词,还可以阅读页面全文 对网页的重要性进行客观的分析。只返回包含所有关键词的网页,其正文或指向它的链接包含用户输入的所有关键词;只摘录那些包含搜索关键词的内容;并按照关键词的接近度确定搜索结果的先后次序,优先考虑关键词较为接近的结果。 2、Google的检索方式 基本检索 高级检索 通常,只需在范围较广的查询中添加词语就可以缩小搜索范围。此外Google还提供了很多不同的搜索功能,利用这些功能可以: ①将搜索范围限制在某个特定的网站中 ②排除某个特定网站的网页 ③将搜索限制于某种指定的语言 ④查找链接到某个指定网页的所有网页 ⑤查找与指定网页相关的网页 3、Google的检索算符和规则 ①自动使用“and”进行查询,返回符合全部查询条的网页。 ②不支持“通配符”(*) 搜索 ③不区分英文字母大小写,所有字母均作小写 ④减除无关资料:在检索词前加上减号(“-”,英文字符),减号前须留一空格 ⑤添加英文双引号来搜索英文短语 ⑥按链接搜索(查询link) 显示所有指向该网址的网页,如:“link:www.google.com”将找出所有指向 Google 主页的网页。 不能将 link: 搜索与普通关键词搜索结合使用 ⑦在某个特定的域或站点中进行搜索 可以在搜索框中输入“site:xxxxx.com”。如要在 Google 站点上查找新闻,可以输入:新闻 Site: google.com ⑧查找PDF文件 可在搜索关键词后加上 -filetype:pdf。 4、Google 的特殊功能 ①网页快照 访问网站时将网页复制一份网页快照,当找不到原来网页时,用户仍可浏览该网页内容 ②类似网页 ③“手气不错™” 用于搜索网页的时间较少,而用于检查网页的时间较多,能找出最符合搜索条件的一个搜索结果 三、中国搜索联盟 http://www.chinasearch.com.cn/ 1、概况 成立于2002年9月,由中国互联网新闻中心、慧聪国际共同发起,以搜索引擎应用为核心的开放型联合体,目前国内最大的“搜索引擎服务平台”,是新一代综合搜索引擎,能实现智能化的全文检索。 2、搜索方法 ①基本检索 空格、“+”、“,”——表示“与”关系 字符“/”——表示“或”关系 字符“-” ——表示“非”关系 ②网页的相关检索 ③进阶式查询检索 有四种选择:重新查询、在结果中再查、在结果中去除和分类下更多结果。 3、搜索结果 查询结果页会分为几个部分: 第一部分为相关网站信息, 第二部分为相关网页信息, 第三部分是相关新闻信息, 第四部分是行业相关信息。 根据关键词与页面或文章标题的相关程度排列搜索结果,相关度高的被排在前面。 新闻检索的结果则是按照日期顺序,日期最近的新闻被排在最前面。 四、雅虎 Yahoo! http://www.yahoo.com 雅虎中国:http://cn.yahoo.com,为中国互联网用户提供本地化的内容和信息交流服务。 1、概况 由美国斯坦福大学两位博士生(大卫·费罗(David Filo) 和杨致远(Jerry Yang)开发,提供强大的全球信息查询功能。 在全球共有24个网站,使用12种语言。是全球第一家提供互联网导航服务的网站。 2、雅虎的功能 强大的搜索功能:通过其14类简单易用、手工分类的简体中文网站目录及强大的搜索引擎搜索信息; 沟通工具:如雅虎电邮、我的雅虎、雅虎通、地址簿、公文包、记事本、效率手册等,方便用户交流; 综合在线内容:新闻中心、雅虎财经、雅虎体育、雅虎科技、雅虎房地产、天气、英汉字典等; 网上虚拟社区:聊天室、俱乐部、网上传情、雅虎相册和雅虎请柬等各种个性化产品; 本地化服务:与人民日报、中新社、北京日报/晚报、中国青年报、路透社、ENET等众多国内外媒体以及垂直网站结成内容供应合作伙伴,由他们为雅虎中国提供本地新闻报道。 3、搜索方式 (1)分类索引查询,即逐层浏览 Yahoo! 有较全面的分类体系,设有14个宽泛的类目,为它所提供的www节点按主题分类建立索引,是分类目录式搜索引擎的一个代表。 (2)关键词检索 直接在普通搜索窗口的对话框中输入关键词进行检索。 4、检索算符 +:keyword +后的检索词一定要出现在搜索结果中,如architecture+arts; -:keyword -后的检索词一定不要出现在搜索结果中,如architecture-design; t:keyword 对“t”后检索词的搜索仅在文献题目中进行; u:keyword 对“u”后检索词的搜索仅在文献的URL中进行; “ ” 字符串检索,如“search engine”; * 在词干的后面加上“*”,后方截词 操作符组合顺序:+、-、t:、u:、“ ”、* 如:检索式:+t:football-American 正确 检索式:t:+football-American 不正确 5、搜索结果 根据关键字与中文类目、网站信息的相关程度来排列相关的类目和网站 五、北大天网 http://e.pku.edu.cn 1、概况 天网中英文搜索引擎是由北京大学计算机系网络与分布式系统实验室设计开发的,是国家“九五”重点科技攻关项目的研究成果,1997年10月29日正式在CERNET上提供Web信息导航服务 支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。 提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点) 天网的一大特色是其FTP搜索引擎。其中的FTP资源相当丰富,数据库约1千多种,电影约2万部、mp3音乐约21万首、图片约100万、程序约25万、源代码20万,文档60万,每日点击量约七万。 检索速度快 2、搜索方法 ①简单检索 在主页文本框中输入关键词并回车,或者点击 “搜索网页”按钮即可。可以限定检索的IP地址段。 ②复杂检索 可以限定文件大小、文件日期、文件类型(文本、图像、视频、目录等)以及限定一页显示的数量。 ③FTP文件搜索 天网将FTP文件分成电影、动画片,mp3音乐,程序下载,开发资源共四大类,用户可以层层点击,查找自己需要的FTP文件。 FTP文件搜索 1、按类别搜索文件 在输入框输入关键字,选择查询类别。 如:输入“笑傲江湖”,选择“电影”类 。 2、充分利用查询串各种格式 禁止单字符查询和空查询 支持* 、?、空格操作。 如:Oicq*.exe Michael Jackson :空格相当于* RFC????.txt :查询格式固定的文件名 3、检索技巧 词与词之间不必加空格 如有相连的外国人姓名,用逗号隔开 操作符用大写字母,网址字符用小写字母 4、搜索结果 搜索结果返回的不是主页的URL,而是一些FTP地址,包括服务器和文件所在服务器的路径。 在检索结果显示页面,标识出检索所用时间和结果数量,并可选择按相关度、时间、文件大小、网络距离、稳定性等排序标准来显示,默认排序依据为稳定性。 六、专题搜索引擎GreatBuilding 1、概况 GreatBuilding.com汇集世界上著名建筑物详细数据:照片、建筑资料、与建筑师和建筑书目的相关链接。下载免费软件后,可观看其中许多建筑物的立体图。 http://greatbuilding.com/cgi-bin/metasearch.cgi?query=building http://www.greatbuilding.com/gbs/buildings.html 七、多元搜索引擎Profusion http://www.profusion.com 可支持Altavista、MSN、Yahoo、 Lycos、AOL、LookSmart等十多个搜索引擎 检索方式:简单检索、高级检索 检索结果:对结果进行链接测试,确保其有效性 搜索引擎的发展已经达到一定规模和一定层次,种类也比较繁多,但搜索引擎的发展本身是无序的,其数据库的覆盖面也相当有限,任何搜索引擎都无法全面涵盖所有的信息,检索结果的准确性和一致性并不能得到强有力的保证。 如果我们只是在网上漫游,享受网络无边世界的乐趣,搜索引擎可以满足我们的要求,但是如果我们想查找某些特定的专业信息,我们必须仍然重视专业数据库的检索。
信息检索ppt:这是信息检索ppt,包括了文献信息检索技术,检索途径与检索语言,计算机信息检索技术,检索步骤等内容,欢迎点击下载。
信息检索作业ppt:这是信息检索作业ppt,包括了作业要求,请列举出我校图书馆数据库中,所有与本专业学科相关的中外文数据库名称等内容,欢迎点击下载。
信息检索文献检索资料搜索ppt:这是信息检索文献检索资料搜索ppt,包括了信息检索概述,文献信息的类型,信息检索的基本方法,信息检索方法,信息检索基本过程等内容,欢迎点击下载。