首页
登陆
注册
博客集
下载频道
网络硬盘
学院论坛
家园
智能模糊搜索
仅搜索标题
网站地图
收藏本站
高级搜索
新闻
:
IT新闻
互联网
微软
黑客新闻
网络
:
网络协议
故障
网络管理
TCP/IP
无线技术
解决方案
黑客
:
技术
漏洞
软件评测
安全资讯
数据
:
MSsql
Oracle
Mysql
PL/SQL
备份
系统:
Linux
vista
Windows
FTP
防火墙
注册表
服务器
:
行情
服务器应用
解决方案
WEB服务器
墙纸
:
风景壁纸
游戏壁纸
体育壁纸
汽车壁纸
人文壁纸
影视壁纸
广告壁纸
花卉壁纸
节日壁纸
动漫壁纸
明星壁纸
绘画壁纸
月历壁纸
当前位置: >
主页
>
数据库技术
>
Oracle
>
开发技术
>
用Ultra Search自建超级搜索
热门文章排行
ORACLE数据库应用开发常
用Ultra Search自建超级
浅谈oracle数据库的建模
Web应用开发工具 —— W
Oracle家电行业供应链及
ORACLE WEBDB Q 与 A
Oracle开发工具介绍
用 VC 开 发 Oracle 数
Delphi 3.0中连接数据库
使用Oracle实现实时通信
精采文章推荐
在不安装Oracle客户端的
最新更新文章
在不安装Oracle客户端的
使用Oracle实现实时通信
Delphi 3.0中连接数据库
用 VC 开 发 Oracle 数
Oracle开发工具介绍
ORACLE WEBDB Q 与 A
Oracle家电行业供应链及
Web应用开发工具 —— W
浅谈oracle数据库的建模
用Ultra Search自建超级
用Ultra Search自建超级搜索
编辑:
来源:
日期:
2008-02-06
我要投稿
家园
Oracle9i数据库的Ultra Search组件能为你的网站提供搜索引擎功能,而且,即使没有软件开发经验的电脑爱好者也可以用不到一天的时间建成自己的搜索引擎。下面就把我制作搜索引擎的全过程展示给大家,下文中所有图片都来自我的搜索引擎实例。
Ultra Search概述
Ultra Search是Oracle公司数据库服务器9i版本的功能组件,是数据库产品的附加功能,它有与其它搜索引擎类似的技术构架,又有自己独到的功能特性。
Ultra Search提供对于四种数据源的基于Web的搜索应用。
1、Web源。
图1为Ultra Search搜索Web站点的情形。
图 1 搜索Web站点(基础搜索)
2、文件源。
文件源是指Ultra Search数据库计算机可以访问的文档集,文件类型为包括Word文件在内的150多种常见格式的文件,也包括图形图象文件和视频剪辑。文档集位于本地或远程主机中,这些文档通过文件协议进行索引,可以根据需要创建任意多不同类型的文件源。HTML和纯文本是始终要处理的默认文档类型。图2为Ultra Search对文件服务器搜索的结果,如图所示,已经找到一个类型为"file"的PowerPoint文件。文件源通过file://协议索引,Ultra Search使用Oracle Text过滤器从文档吸取文本和元数据,并自动识别文档类型。如:Microsoft Office Suite 95/97/2000、Spreadsheet documents(如Microsoft Excel、Lotus 1-2-3)、Word 文件(如Microsoft Word 和 Corel Word Perfect)、Acrobat PDF文件、图形表现文件(如Microsoft PowerPoint、Lotus Freehand)等。
图 2 搜索文件服务器(高级搜索)
3、电子邮件源
电子邮件源代表发送到特定邮件地址的所有邮件,可以将Ultra Search配置为从IMAP服务器搜索电子邮件,这个功能对于搜索发送到邮件列表的邮件特别有用。
4、表源
表源是其内容来源于数据库表的数据源,可创建任意多个新表源,表可来源于多个数据库链接,可以是Oracle数据库或通过ODBC连接的非Oracle数据库,可以实现针对表中列的高级搜索。
Ultra Search是一个全面基于Oracle Text的应用程序,它为Oracle Text用户提供界面友好的Web形式的搜索能力而不需要任何深层的SQL编程,而大量深层技术已被嵌入到转化和调整Web页面查询到底层的基于SQL的Oracle Text查询的过程中。Ultra Search使用对Oracle Text用户来说同样有效的公共接口建立,但增加了相当可观的专门技术在聚集信息的索引、转换查询上,因此有更高质量的查询性能和可扩展的最优化操作。因为Oracle Text与Oracle数据库高度集成,所以实现了Ultra Search自由与动态数据交互。
Ultra Search的组成
Ultra Search由3个组件组成:
1、服务器组件
服务器组件是Oracle9i数据库服务器中的一个组件,它包括:Ultra Search资料库(Ultra Search数据字典、PL/SQL包、Crawler Java类、Ultra Search产品库)、Oracle Text和远程Crawler。
2、Crawler
"Crawler"英文本意是爬行动物,而在搜索引擎中它象蜘蛛一样爬行在Internet这张网上,爬行过程就是收集信息并建立索引的过程。
3、中间层组件
中间层组件是Oracle9i数据库服务器的一部分并随着客户端的安装被安装在相同的目录下(可单独定制安装),它包括:管理工具、Java查询应用程序接口、Java电子邮件应用程序接口和JSP查询应用程序。管理工具是JSP页面的Web应用程序,你可以使用它配置和规划数据库实例、数据源、Crawler,管理用户和查询组。Java应用程序接口使用JDBC连接池实现可伸缩性,Java电子邮件应用程序接口用于访问和显示已归档的电子邮件。用户可基于这些接口开发自己的查询应用程序。Ultra Search已经提供一个功能很强的查询应用程序,见图1基础搜索和图2高级搜索,它们基于JSP页面并能工作于任何符合JSP1.0规范的Web服务器引擎。
本文只介绍Ultra Search对Web源和文件源的搜索实现过程。
系统环境为:
● 操作系统:Windows 2000 Advance Server,IIS5.0;
● 数据库:Oracle9.0.1企业版;
● 运行方式:数据库服务器、客户端管理工具和Oracle HTTP Server都运行在同一台主机上。
Oracle9i数据库企业版可从Oracle网站(www.oracle.com免费下载,它已经包含了建设Ultra Search搜索引擎所需要的全部软件组件,另外还需大内存计算机来运行数据库。
如果你的计算机已经安装Oracle9i数据库企业版,则需要设置初始化参数:
O7_DICTIONARY_ACCESSIBILITY=TRUE
SHARED_POOL_SIZE=50000000(或更大)
LARGE_POOL_SIZE=5000000(或更大)
SORT_AREA_SIZE=5000000(或更大)
JOB_QUEUE_PROCESSES=2(或更大)
不能设置数据库为多线程服务器(MTS),因为它不支持Oracle Text记录。
安装
安装过程很简单,大多数设置已由系统自动实现。如果你的系统没有安装Oracle数据库,你必须使用Oracle通用安装器定制安装数据库,选择Ultra Search功能和数据库客户端管理工具;反之,需要通过数据库配置助手(DBCA)在已经运行的数据库上追加安装Ultra Search功能,并检查客户端管理工具是否完全安装。安装数据库时选择使用数据库中的Oracle HTTP Server作为JSP Web服务器引擎。下文约定:ORACLE_HOME代表Oracle数据库主目录,WEB_ORACLE_HOME代表中间层组件的安装目录,本例中二者相同。
硬件要求:
1、内存要求:大于等于256MB。
2、硬盘空间要求:
(1)至少1.4GB硬盘空间安装Oracle9i服务器;
(2)相当于物理内存大小的临时表空间;
(3)Ultra Search实例的用户表空间需求。要明确建立一个数据库用户作为Ultra Search的实例用户,所有搜索引擎需要的表和索引等数据库对象都存储在这个用户模式下,一般要建立与你将要索引的数据源相同大小的表空间作为Ultra Search实例用户的缺省表空间。
上一页
1
2
下一页
复制本网址推荐给QQ/Msn好友分享!
上一篇:
ORACLE数据库应用开发常见问题及排除
下一篇:
浅谈oracle数据库的建模与设计
关键字:
智能模糊搜索
仅搜索标题
【
文章评论
】 【
收藏本文
】 【
推荐好友
】 【
打印本文
】 【
论坛讨论
】
相关文章:
·
在不安装Oracle客户端的情况下进行系统移植
·
使用Oracle实现实时通信
·
Delphi 3.0中连接数据库的三种方式
文章评论:
(0条)
请留名:
匿名评论
点击查看所有评论
责任编辑:IT学院
声明:刊登此文章是为了传递更多信息,文章内容仅供参考,转载请注明出处。