原本项目是基于MYSQL的,现因需求将其转换为MYSQL+Elasticsearch,MYSQL的ORM使用的是Spring Data Jpa,Mybatis的转换与其类似,有人看再更
先看原项目
原项目的DAO层
@Repository
public interface UserRepository extends JpaRepository<User, Long> {Optional<User> findOneByActivationKey(String activationKey);List<User> findAllByActivatedIsFalseAndCreatedDateBefore(Instant dateTime);Optional<User> findOneByResetKey(String resetKey);Optional<User> findOneByEmailIgnoreCase(String email);Optional<User> findOneByLogin(String login);@EntityGraph(attributePaths = "authorities")Optional<User> findOneWithAuthoritiesById(Long id);@EntityGraph(attributePaths = "authorities")Optional<User> findOneWithAuthoritiesByLogin(String login);@EntityGraph(attributePaths = "authorities")Optional<User> findOneWithAuthoritiesByEmail(String email);Page<User> findAllByLoginNot(Pageable pageable, String login);
}
原项目的DTO
1.User.java
@Entity
@Table(name = "user")
public class User implements Serializable {private static final long serialVersionUID = 1L;@Id@GeneratedValue(strategy = GenerationType.IDENTITY)private Long id;@NotNull@Pattern(regexp = Constants.LOGIN_REGEX)@Size(min = 1, max = 50)@Column(length = 50, unique = true, nullable = false)private String login;@JsonIgnore@NotNull@Size(min = 60, max = 60)@Column(name = "password_hash", length = 60, nullable = false)private String password;@Email@Size(min = 5, max = 254)@Column(length = 254, unique = true)private String email;@NotNull@Column(nullable = false)private boolean activated = false;@Column(name = "reset_date")private Instant resetDate = null;@JsonIgnore@ManyToMany@JoinTable(name = "jhi_user_authority",joinColumns = {@JoinColumn(name = "user_id", referencedColumnName = "id")},inverseJoinColumns = {@JoinColumn(name = "authority_name", referencedColumnName = "name")})@BatchSize(size = 20)private Set<Authority> authorities = new HashSet<>();//...
}
2.Authority.java
@Entity
@Table(name = "jhi_authority")
public class Authority implements Serializable {private static final long serialVersionUID = 1L;@NotNull@Size(max = 50)@Id@Column(length = 50)private String name;
}
可以看出原项目使用Spring data + hibernate 作为ORM,规范的使用其格式进行自动生成SQL语句
接下来就是转换成elasticsearch的时候了
这里我不采用elasticsearch官网的client依赖包而是spring-data-elasticsearch,原因如下:
- 官网提供的low包就是一个httpclient,做业务操作时需要自己编写json,几百个接口就要编写几百次json,过于麻烦
- 官网提供的high包必须要与elasticsearch对应版本才行,不然项目就运行不起来
- 原项目是使用Spring-data-jpa的,这里用spring-data-elasticsearch在更改时会方便很多
①首先先配置elasticsearch
pom.xml加入
<dependency><groupId>org.springframework.data</groupId><artifactId>spring-data-elasticsearch</artifactId></dependency>
若你是spring boot项目,则在 application.yml 或者 application.properties 加入
spring: data:elasticsearch:cluster-nodes: localhost:9300
若你是普通spring项目则看
Spring Data Elasticsearchdocs.spring.io进行配置
②改造DTO
把原有的spring data 注解删除掉
然后替换成elasticsearch的注解
@Document(indexName = "user", type = "doc")
public class User {//这里的instant jackson无法直接从string转换为instant,需要编写个编解码类@JsonSerialize(using = InstantJacksonSerializer.class)@JsonDeserialize(using = InstantJacksonDeserialize.class)private Instant createdDate;private String createdBy;private boolean activated;//原项目Id,是使用Long类型,这里不改,但elasticsearch的话推荐使用String作为Id,因为自动创建id的时候为随机字符串@Idprivate Long id;private Set<Authority> authorities;private String login;private String email;//...
}
可以看到,我除了删除了原项目的注解外,DTO就只有添加了 @Document(indexName = user", type = "doc") ,Instant是原项目使用的,如果是用Date的话则使用 @JsonFormat(pattern="yyyy-MM-dd HH:mm:ss")
③改造DAO层
先看改造后的
public interface UserRepository extends ElasticsearchRepository<User, Long> {Optional<User> findOneByActivationKey(String activationKey);List<User> findAllByActivatedIsFalseAndCreatedDateBefore(Instant dateTime);Optional<User> findOneByResetKey(String resetKey);Optional<User> findOneByEmailIgnoreCase(String email);Optional<User> findOneByLogin(String login);Optional<User> findOneByEmail(String email);Page<User> findAllByLoginNot(Pageable pageable, String login);}
将UserRepository 改为继承ElasticsearchRepository<User, Long> ,其中第一个参数为DTO,第二个参数为Id,把连表的with给去掉即可(IDEA中用shift+F6可以很方便的),若你需要特殊查询,可以使用
@Query("{"bool" : {"must" : {"field" : {"name" : "?0"}}}}")Page<Book> findByName(String name,Pageable pageable);
④关于join的问题
Elasticsearch是不支持join操作的,可以有以下几种解决方案
- 因SQL不支持数组才把其放入其他表的,Elasticsearch本身支持数组,直接放入同一张表
- 一对多,一对一,多对一情况下的,可以考虑数据冗余,直接加入同一张表中,Elasticsearch本身储存的数据会进行压缩的,数据冗余可以接受,在不加索引情况下可能达到MYSQL十分之一的存储空间
- 使用父子关系(不推荐,之前看到好像在将来的版本会被废弃?)
- 两次查询解决join问题(实在没办法了就只能这样做了)
在本项目中我用的是方案一,再复杂点的情况之后再考虑
⑤关于遇到的坑
//MYSQL@Size(max = 50)@Column(name = "first_name", length = 50)private String firstName;//Elasticsearchprivate String firstName;
MYSQL数据库里储存的字段名都是first_name这样以下划线作为分词的,而spring data Elasticsearch 我并没有找到转义的相应注解。。。。如果有人知道麻烦告诉下
我的解决方案:
在导入数据源的时候,把其改为驼峰法的结构
⑥数据导入
我使用的是logstash,还有其他框架可以使用,按需求自己决定吧