一、通过Java访问Solr服务(手动创建索引库)
1、创建项目,配置环境(导包及相关文件)
1、SolrJ核心包 /solr-4.10.3/dist/solr-solrj-4.10.3.jar
2、SolrJ依赖包 /solr-4.10.3/dist/solrj-lib下的所有包
3、日志依赖包 /solr-4.10.3/example/lib/ext目录下的所有jar包
4、JDBC驱动包 mysql-connector-java-5.1.10-bin.jar
5、拷贝log4j.properties到src目录下。(或者创建一个Source Folder)
项目结构如下所示
2、编写代码
【1】采集数据
1】创建pojo,创建Product类
package cn.jinshan.pojo;
public class Product {
private Integer pid;
private String name;
private String catalogName;
private double price;
private String description;
private String picture;
// 补全get、set方法}
【2】创建连接数据的 ProductDao类
package cn.jinshan.dao;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.util.ArrayList;
import java.util.List;
import cn.jinshan.pojo.Product;
public class ProductDao {
public List getAllProducts() {
List products = new ArrayList<>();
//连接数据库 Connection connection = null;
PreparedStatement prepareStatement=null;
ResultSet resultSet = null;
try {
//加载驱动 Class.forName("com.mysql.jdbc.Driver");
//获取连接 connection = DriverManager.getConnection("jdbc:mysql://127.0.0.1:3306/solr", "root", "gzsxt");
//获取预处理编译对象 prepareStatement = connection.prepareStatement("select pid,name,price,description,catalog_name,picture from products");
//执行 resultSet = prepareStatement.executeQuery();
Product product = null;
while (resultSet.next()) {
product = new Product();
product.setPid(resultSet.getInt("pid"));
product.setName(resultSet.getString("name"));
product.setPrice(resultSet.getDouble("price"));
product.setDescription(resultSet.getString("description"));
product.setCatalogName(resultSet.getString("catalog_name"));
product.setPicture(resultSet.getString("picture"));
products.add(product);
}
} catch (ClassNotFoundException e) {
e.printStackTrace();
} catch (SQLException e) {
e.printStackTrace();
}finally {
if (resultSet !=null) {
try {
resultSet.close();
} catch (SQLException e) {
e.printStackTrace();
}
}
if (prepareStatement != null) {
try {
prepareStatement.close();
} catch (SQLException e) {
e.printStackTrace();
}
}
if (connection !=null) {
try {
connection.close();
} catch (SQLException e) {
e.printStackTrace();
}
}
}
return products;
}
}
【3】创建一个测试类,测试能否取出数据
package cn.jinshan.test;
import org.junit.Test;
import cn.jinshan.dao.ProductDao;
public class ProductDaoTest {
@Test
public void getAll() {
ProductDao dao = new ProductDao();
System.out.println(dao.getAllProducts());
}
}
注:运行测试类,控制台可以打印出数据,则证明数据采集正常
【2】将数据转换成Solr文档SolrInputDocument
1】将文档的域配置在Solr实例的schema.xml配置文件中,如下图所示:
2】通过代码将数据转为SolrInputDocument文档
//将采集的数据转为SolrInputDocument文档 public List getSolrDocument(List products) {
List solrInputDocuments = new ArrayList<>();
SolrInputDocument solrInputDocument = null;
for (Product product : products) {
solrInputDocument = new SolrInputDocument();
//此处addField的域,必须跟实例的schema.xml配置文件中配置的域相同 solrInputDocument.addField("id", product.getPid());
solrInputDocument.addField("product_name", product.getName());
solrInputDocument.addField("product_catalog_name", product.getCatalogName());
solrInputDocument.addField("product_price", product.getPrice());
solrInputDocument.addField("product_description", product.getDescription());
solrInputDocument.addField("product_picture", product.getPicture());
solrInputDocuments.add(solrInputDocument);
}
return solrInputDocuments;
}
3】手动创建索引库(执行方法后,课查看实例中是否生成数据(位置:D:\java\solr\solrHome\collection1\data\index))
//手动创建索引库 @Test
public void createIndex() {
ProductDao productDao = new ProductDao();
//将数据加入到Solr的索引库 //第一步:连接Solr HttpSolrServer solrServer = new HttpSolrServer("http://localhost:8888/solr/solr1");
try {
solrServer.add(productDao.getSolrDocument(productDao.getAllProducts()));
solrServer.commit();
} catch (SolrServerException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
三、Solr服务插件及其他配置(通过配置文件系统自动创建索引)
可以在管理界面直接从数据库导入数据到索引库,不需要通过手动创建索引的全部操作
1、安装DataImport插件
【1】配置依赖包
将/solr-4.10.3/dist/solr-dataimporthandler-4.10.3.jar拷贝到/depJar/contrib/dataimporthandler/lib目录下
将jdbc驱动包拷贝到 /depJar/contrib/db/lib 目录下
【2】 加载依赖包的相关配置
在相关实例的solrconfig.xml文件中,加载这两个jar依赖,如下所示:
2、配置 数据库表和solr域的映射关系
【1】创建配置文件
在solr实例的conf目录下,配置数据库映射文件data-config.xml(建议不要修改配置文件名字),文件内容如下:
为数据库连接的相关配置
...数据库表和solr域的关联相关配置(column为表的字段,name为solr域的名称)
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/solr"
user="root"
password="gzsxt"/>
配置完成,重启solr服务;
访问solr服务控制台如下,则插件安装完成
2、配置中文分析器 ( IKAnalyzer)
【1】 把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下
【2】 拷贝IkAnalyzer的配置文件IKAnalyzer.cfg.xml到solr/WEB-INF/classes目录下
IK Analyzer 扩展配置
stopword.dic;
【3】 在schema.xml中自定义一个FieldType,指定中文分词器IKAnalyzer
注:指定中文分词器后,solr域中的个别域的类型就不能写text_general就需要改成text_ik