Web搜索引擎工作原理和体系结构

VIP免费
3.0 朱铭铭 2024-09-20 5 4 3.01MB 57 页 150积分
侵权投诉
Web 搜索引擎工作原理和体系结构
第一章 绪论
1.1 课题背景
在世界经济一体化、全球化不断加快的今天,信息技术越来越广泛地应用于各个领域。
电子商务作为信息技术与现代经济贸易活动结合的产物,成为人类进入知识经济时代的重要
标志之一。它不仅会改变着企业本身的生产、经营、管理活动,而且将影响到整个社会的经济
运行与结构,并最终影响到国家在国际经济生活中的地位和作用。电子商务有四大主要的体
系,第一是信用体系,第二是要具有强大的市场,第三是完善的支付体系,第四便是健全的
搜索功能,信用、市场、支付和搜索将成为中国电子商务的四大护法。未来电子商务的发展跟
搜索引擎是密不可分的,全世界的电子商务离不开搜索引擎,全世界的搜索引擎也离不开中
国的搜索引擎。
随着因特网的发展,网上资源日益丰富,越来越多的人开始从网上获取信息。搜索引擎
成为互联网上最重要的应用之一,其能够协助用户在浩如烟海的互联网信息中找到用户所需
的信息,深受网民的喜爱。目前,互联网搜索引擎已经成为人们网上冲浪获取知识、查找信
息的一个重要手段。经过近十年来的高速发展,已经形成了几个有代表性的功能强大的搜索
引擎,如 googlebaidu 等我们经常使用的搜索引擎。作为比较有代表性的产品,它们吸收并
集成了相关领域最先进的技术并给用户提供了友好方便的使用环境和多样、灵活的扩展功能。
课题的目标在于建设一个与北京彤彩空间视觉装饰材料有限公司发展相一致的电子商务
平台,扩大其影响力与知名度,并展现出北京彤彩空间视觉装饰材料有限公司的实力,从而
为北京彤彩空间视觉装饰材料有限公司的网站经营起到促进作用。北京彤彩空间视觉装饰材
料有限公司网站在设计上遵循高起点,结合网站论坛业务,以网站页面设计的
效果着手,从分体现人性化的开发建设思想,在技术和务上进行应用秉承
北京彤彩空间视觉装饰材料有限公司“精求精,好要好,以分体现北
彤彩空间视觉装饰材料有限公司、多样化满足消费的需求”的经
课题用动技术,网站的数据进行更新改、删除等,过网站的动
理,大大提网站数据作。除此,课题在设计务平台时针对课题目标还制
了一系的设计原则:
1表现性Representation
B/S 过丰富灵活的 WEB 表现方,最大限度的方便用户
护大网站系种栏页面体、颜色显示属网站护人员自定义
从而保证方便、快速的构建丰富的、个性化的户网站。
2)专业性Specialization
Web 搜索引擎工作原理和体系结构
相结合公司身的实际状况公司的宣传和电子商务对外介绍北京彤
彩空间视觉装饰材料有限公司网站身,最主要的目的是向外展,从而创造更多的商
时,提供国各个驻外机构的岛外延伸服务。提供国信息,进行一的专项
销服务。占据内面向国际市场重要窗口,使公司加快步伐走向国际市场。
3实用性 Utility
实用性要网站提供的功能浏览者实际需的,且合北京彤彩空间视
觉装饰材料有限公司网站的特点。
4作性Maneuverability
设计的核心作,信息的获取加的方便,不论是浏览的用户
网站运营护的用户,设计的易于,不需互联网技深了体现人性化
的特点。
5)艺术性Artwork
术性要求页面创作从某种意义上要到吸引球的目的。将在北京彤彩空间视觉装饰
材料有限公司网站的网设计借鉴名网站的设计特点,并合企业发展
打造"彤彩"优势,并广成为各体、各域主
6性能Performance
访问速度,取器接入方带宽摆放地点、硬件性能和页面数据量
拥塞程度等多方因用全数据的设计,使网站的信息的得非常方便
数据库内任何内容,用户可以方便的索出来,支标题和全文检索,免去页页翻
7)安全性Security
全性一个网站是重的地位,直接就对网站的运行,有重要作用,所
以要在网管理进行身确定信息的全性要北京彤彩空间视
觉装饰材料有限公司网站的开发建设应考虑,如网站管理份确定
信息的全、不可否认改等。
开发要求外北京彤彩空间视觉装饰材料有限公司网站进一身开发
目的出发,加入个性化搜索引擎的设计允许过网站实现品索、风格
索、图案搜索、搜索、颜色搜索以及型号搜索等个性化搜索功能,为用户提供渠道
展现公司业务内容,将搜索引擎技术和电子商务为一体,体现电子商务发展的新导向
1.3 课题技主要理论和最终目标
课题以宣扬北京彤彩空间视觉装饰材料有限公司企业形和业务为核心,提供丰富动、
静态信息,调文化、、商务等多功能务,合各经营活动,将北京彤彩空间视
觉装饰材料有限公司网站建成牌门户网站时在实现户网站建设时,
将技术重点到了搜索功能上,搜索引擎技术,核心算法、键字处理和结
果处作了化,使其能够提供为强大、全和快速的搜索功能。
Web 搜索引擎工作原理和体系结构
搜索引擎自己搜索机器”(ROBOTS,并这些 ROBOTS 在网沿
上的链接(http src 链接)取资料建立自己数据库 于网站管理
内容提供,有时会有一站点内容,不希望被 ROBOTS 取而公开。为了解决这
题,ROBOTS 开发界提供了个是 robots.txt一个The Robots META
robots.txt 是一文件明该站中想被 robots 访问
分,样,站的部内容就可以不搜索引擎收了,或者指定搜索引擎
访
robots.txt,如找到,搜索按照该文件确定访问,如果该文件
在,那么搜索机器就沿链接抓取。 robots.txt 必须放置在一个站点的录下,而且
文件必须部小写
robots.txt 文件主要用于限整个站或者搜索引擎访问情况,而 Robots META
签则主要是针对一个个具体的页面和其META 签(如使用的语言页面描述
一样,Robots META 也是<head></head>搜索引擎
ROBOTS 何抓该页内容
robots.txt Robots META
,目前支的并不多,逐渐增加,如名搜索引擎 GOOGLE 完全支在课
题建设中,作robots.txt 方法用以搜索和不搜索的网站,不仅可以提高
搜索的效率加提高了搜索的全性。
Web 搜索引擎工作原理和体系结构
第二章 搜索引擎的分析与设计
2.1 搜索引擎基本要求
受用户浏览器的查词或者Q。在一个可以受的时间返回
个和用户查信息表,L表的至少包含三个素(
题,网链接
可以受的时间,也是响应时间。于在 Web 个时间不能
常也”这搜索引擎可用性的一个,也是和传统
索系的一个进一的,的响应时间要不仅要满足个用户查,而
且要能在系设计负载情况下满足有的用户。也,系情况
下保证秒级响应时间。配”的是网中以某种包含Q内容,其中最简单
的形式就Q在其中直接出现。不过我们会到,如一个搜索引擎是以分之
满足这种简单包含关系为目标,使实现了也并不就达到了最好的效果
“列蕴含着一种“顺序数情况L是相的,1
(这是和书馆文检索系一个里返回如几十个
不仅是Web 上的信息大,也于搜索引擎的查简单简单
;抽着有的具体物可能是它的体现。于一个长长有用户
心都仅是因为大多使用搜索引擎的用找到
而不是找到不罢休,加表中和一个用户关其实只占的比
有分计表,用户平返回2。现代大搜索引擎一般采
三段的工作流程:搜集、理和查务。
果说是工作在数据集合上的统操作的数据不仅包括
不可预测的用户查包括上动变化的海,并且这些不会主动
到系来,而是需要统去抓取。先,我们考虑抓取的时:事时。在网比较
情况下,从网需要 1 秒钟左右,因用户查的时
网上来成的网,一个个分理,和用户的查询匹,不可能满足搜索引擎的
响应时间要。不仅如的系统效益也不高(会重多的网);面对
摘要:

Web搜索引擎工作原理和体系结构第一章绪论1.1课题背景在世界经济一体化、全球化不断加快的今天,信息技术越来越广泛地应用于各个领域。电子商务作为信息技术与现代经济贸易活动结合的产物,成为人类进入知识经济时代的重要标志之一。它不仅会改变着企业本身的生产、经营、管理活动,而且将影响到整个社会的经济运行与结构,并最终影响到国家在国际经济生活中的地位和作用。电子商务有四大主要的体系,第一是信用体系,第二是要具有强大的市场,第三是完善的支付体系,第四便是健全的搜索功能,信用、市场、支付和搜索将成为中国电子商务的四大护法。未来电子商务的发展跟搜索引擎是密不可分的,全世界的电子商务离不开搜索引擎,全世界的搜...

展开>> 收起<<
Web搜索引擎工作原理和体系结构.doc

共57页,预览4页

还剩页未读, 继续阅读

作者:朱铭铭 分类:高等教育资料 价格:150积分 属性:57 页 大小:3.01MB 格式:DOC 时间:2024-09-20

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 57
客服
关注