.::: 一路问情 :::.
  • 注册
  • 登录
  • 会员
  • FTP资源中心
  • 七海争霸
  • 社区设施
  • 帮助
.::: 一路问情 :::. » 『建站技术』 » 用Java+MySQL+PHP轻松构建跨平台的搜索引擎
‹‹ 上一主题 | 下一主题 ››
发新话题
  • 发新话题
  • 发布投票
  • 发布商品
  • 发布悬赏
  • 发布活动
  • 发布辩论
  • 发布视频
打印

[技术] 用Java+MySQL+PHP轻松构建跨平台的搜索引擎

guaiguai1107
看贴不回的后果

中级会员

Rank: 2

帖子
81 
威望
78 点 
金钱
148 元 
好评
0 点 
  • 个人空间
  • 发短消息
  • 加为好友
  • 当前离线
1楼 大 中 小 发表于 2008-2-20 17:26  只看该作者

用Java+MySQL+PHP轻松构建跨平台的搜索引擎

此搜索引擎适于在一个中等规模的局域网中使用,由于找到的网页存在数据库中,不仅可以索静态的HTML页面,可以搜索php、asp等动态页面。对于一个拥有5万个网页的系统(使用PII-400作为服务器),搜索响应时间在2-10秒左右,完全可以满足要求,由于Java、MySQL、PHP都是跨平台的软件,所以此搜索引擎不仅可以工作在Windows服务器上,而且也可以工作在Linux等其他系统中。

  一、建立搜索引擎需要的数据库和数据表。

  首先建立数据库:

  c:\mysql\bin\> mysqladmin -uroot -pmypasswd create Spider

  然后建立数据库中的表结构

  c:\mysql\bin\> mysql -uroot -pmypasswd Spider < Spider.mysql

  其中Spider.mysql为一个文本文件,其内容如下:

CREATE TABLE link (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Class tinyint(3) unsigned NOT NULL default 0 ,
IsSearchLink tinyint(3) unsigned default 0,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url),
KEY Class (Class)
);

  # 本局域网的初始主页地址,搜索蜘蛛从此网址开始搜索所有其他网页


INSERT INTO link VALUES( '1', 'HTTP://102.211.69.1/', '0', '0');

  # 数据表 webpagelocal 用来存放下载的所有的网页


CREATE TABLE webpagelocal (
Id int(10) unsigned NOT NULL auto_increment,
Url varchar(120) NOT NULL,
Content text NOT NULL,
PRIMARY KEY (Url),
UNIQUE Id (Id),
KEY Url (Url)
);

  # 数据表 webpagefindfast

  # 用MakeFast.php从表webpagelocal中提取512字节的检索信息存放其中

CREATE TABLE webpagefindfast (
Id int(10) unsigned NOT NULL,
Url varchar(120) NOT NULL,
Title varchar(64),
Content blob,
PRIMARY KEY (Url),
KEY Url (Url),
KEY Title (Title)
);



QQ
UID
71395 
精华
0 
积分
78 
钻石
0 克拉 
宣传
0 点 
来路
朋友介绍 
阅读权限
20 
性别
男 
来自
qq 
在线时间
5 小时 
注册时间
2008-2-20 
最后登录
2008-2-29 

查看详细资料

TOP

玉书林风

初级会员

帖子
98 
威望
21 点 
金钱
105 元 
好评
0 点 
  • 个人空间
  • 发短消息
  • 加为好友
  • 当前离线
2楼 大 中 小 发表于 2008-3-23 16:44  只看该作者
学习了.................




QQ
UID
75031 
精华
0 
积分
21 
钻石
0 克拉 
宣传
0 点 
来路
搜索引擎 
阅读权限
10 
性别
男 
来自
东莞 
在线时间
10 小时 
注册时间
2008-2-27 
最后登录
2008-4-5 

查看详细资料

TOP

‹‹ 上一主题 | 下一主题 ››
发新话题
 

 

当前时区 GMT+8, 现在时间是 2008-7-7 05:13 蜀ICP备08000616号

清除 Cookies - 联系我们 - Ask Love - Archiver - WAP - TOP

Powered by Discuz! 6.0.0 []

Processed in 0.012861 second(s), 5 queries, Gzip enabled.

  • 控制面板首页
  • 编辑个人资料
  • 积分交易
  • 积分记录
  • 公众用户组
  • 个人空间管理
  • 资源中心
  • 名人堂
  • 社区银行
  • 醒目高亮
  • 勋章中心
  • 空间互踩
  • 便民查询
  • 邮箱图标
点击查看问情在alexa中的世界排名
点击查看问情在alexa中的世界排名