如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
真水无香:705642839
本文分为两部分,第一部分介绍了Ubuntu10.10下配置Nutch1.2的方法。第二部分介绍
Eclipse下编译运行Nutch1.2的方法。说明:这两部分内容均参考了互联网上的博客文章,
本文末尾会给出参考文献。
一、Ubuntu下配置Nutch
因为Nutch是一个搜索引擎,是一个应用程序,里面包含了爬虫、索引和提供搜索。所
以为了提供查询服务,还需要下载tomcat,另外呢因为Nutch是使用java开发的,其运行
自然少不了jdk啊。本文采用的jdk版本是jdk-6u24-linux-i586.bin;Nutch版本是1.2,tomcat
版本是apache-tomcat-7.0.14。这些软件都可以去官方下载,闲话少叙,下面进入配置流程:
首先配置jdk,如果机器未安装jdk的话需要进行配置,即命令行下进入jdk-6u24
-linux-i586.bin所在文件夹,输入./jdk-6u24-linux-i586.bin,等待片刻,就会在同一目录下生
成jdk1.6.0_24文件夹,之后配置环境变量,命令行下执行sudogedit/etc/environment,更
新PATH,并添加CLASSPATH以及NUTCH_JAVA_HOME,如下:
PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/opt/jdk1.6/bi
n"
CLASSPATH=".:/opt/jdk1.6/lib"
NUTCH_JAVA_HOME="/opt/jdk1.6/"(配置nutch的时候会用到)
TOMCAT_HOME="/opt/tomcat/"(这个事tomcat的环境变量,在此一起配置了)
以上环境变量中的’/opt/’这是我放置各个软件的目录,如果软件放在别的地方,此处要做对
应的修改。
配置tomcat
增加一tomcat用户,gedit/opt/tomcat/conf/tomcat-users.xml,在</tomcat-users>前面加
入一行:<userusername=”admin”password=”password”roles=”admin,manager”/>
为解决搜素过程中的乱码问题,修改tomcat下的server.xml文件,设置为utf8编码。
gedit/opt/tomcat/conf/server.xml,将connector改为:
<Connectorport="8080"protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443"
URIEncoding="UTF-8"
useBodyEncodingForURI="true"/>
启动tomcat:运行bin下的startup.sh,查看http://localhost:8080,看到tomcat页面,成
功。
{常见问题:
(1)对tomcat6/bin下所有的sh文件进行chmod授权,如:sudochmod+xdigest.sh。
否则报错:T
heBASEDIRenvironmentvariableisnotdefinedcorrectlyThisenvironmentvariableis
neededtorunthisprogram
(2)在tomcat6文件夹下创建一个名为logs的文件夹:mkdir
/home/username/tomcat/tomcat6/logs
否则报错:touch:无法触碰“/tomcat/tomcat6/logs/catalina.out”:没有那个文件或目录
ps:如果运行时遇到问题,可以打开logs查看问题信息。
Tomcat
的网页主目录是/tomcat/tomcat/webapps/,只需在webapps目录中添加相应网页即可
真水无香:705642839
在浏览器访问,Tomcat默认目录是webapps下的ROOT目录。
如果页面无法载入,并在logs/catalina.out中出现错误:
信息:TheAPRbasedApacheTomcatNativelibrarywhichallowsoptimalperformancein
productionenvironmentswasnotfoundonthejava.library.path:
/usr/lib/jvm/java-6-sun-1.6.0.24/jre/lib/i386/client:/usr/lib/jvm/java-6-sun-1.6.0.24/jre/lib/i386
:/usr/lib/jvm/java-6
as****16
实名认证
内容提供者
最近下载