数据挖掘图书馆员应掌握的基本工具微引流
- 微引流
- 2022-06-20 17:30
王绿园康梅英武汉解放军体育学院摘要:本文揭示了在未来数字图书馆中图书馆员进行信息服务的一种方式;论述了数据挖掘和WEB挖掘的基本原理和方法;强调图书馆员应掌握数据挖掘这项新技术的必要性
网站推广的工具
网站推广
由于WEB技术的巨大成功,人们越来越多地依靠INTERNET来获取知识、信息
显然,人们到图书馆的次数和时间已越来越少,总有一天,人们再也不会亲自跑到图书馆去借一本书或某个问题
经过艰苦的研究已成功地建立了数字图书馆
数字图书馆是一个标准的电子信息基础设施,它采用分布数据存储,用户可以通过各种链接和操作在一个较大的地域范围内搜索和检索出自己所需的信息,而且整个操作对用户是开放的
也就是说,数字图书馆能够把数据存储在多个站点中,用户只须一个简单的操作就可从这些站点中搜索信息
但是,从网络技术角度来看,数字图书馆与其它WEB信息源没有两样,它们都是建立在INTERNET上的信息站点
从用户的角度来看,他们关心的是从INTERNET上获得信息和知识,他们不能体会到你是数字图书馆还是INTERNET上的一般站点
我们知道在数字图书馆中,图书馆员是信息专家,他们是信息组织者、信息生产者、信息服务者和信息管理者
正是通过图书馆员的信息服务活动使数字图书馆有别于其它信息站点
那么,图书馆员特别是院校图书馆中的图书馆员在二十一世纪的数字图书馆中应如何进行信息服务
这是当前图书馆界应该研究的重要问题
二、技术的选择WEB是一个非常成功的信息系统
WEB的非结构化信息传播和获取方式引发了信息爆炸
人们开始提出一个新的口号:“要学会抛弃信息”
要知道,各高等院校或研究所里的专家教授们由于研究课题计划的紧迫,他们急需本专业领域的最新最权威的知识和信息,他们没有时间在成千上万的站点中的数不清的页面中查找所需的信息
图书馆员们运用信息管理技能,直接为用户提供有用信息
图书馆员们应抓住机会,认真考虑在INTERNET环境中,如何使其服务领域得以扩宽,从桌面服务扩展到基于WEB信息空间电子服务
WWW是众多情报类型中的一种,并且具有极大的特殊性
为此,图书馆员必须选取某个工具来有效地组织和获取WWW中的信息
传统的搜索引擎根本不评估站点的内容,而只是机械地识别WEB设计者提供的关键字,即使是最优秀的搜索引擎也需要用户亲自访问到不同的站点并对信息加以验证
而WEB挖掘技术是克服这些缺点的最理想的工具
原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据
发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的
发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护
在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点
近年来,研究人员正努力研究WEB内容挖掘,开发智能化的信息检索工具
这种方法是把WEB中异构的非结构化的数据集成和组织成结构化的数据,就像关系数据库那样,然后用标准的数据库查询机理和数据挖掘技术来访问和分析这些信息
上一篇:确保搜索引擎成功微引流