Java远程调用框架 ElasticSearch介绍 文档操作类库介绍

2016-07-13 20:56:00
admin
原创 1466
摘要:Java远程调用框架 ElasticSearch介绍 文档操作类库介绍

一、Java远程调用框架

1、Thrift是一个远程调用框架,用来提供一些实时性不太高的服务;

2、gRPC是一个远程调用框架,谷歌出品,更加的规范,更好的支持;


二、ElasticSearch介绍

ElasticSearch是一个基于Lucene的搜索引擎,是具备分布式和多用户能力的全文搜索引擎,提供RESTful接口。ElasticSearch是用Java语言开发的,并做为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。


三、文档操作类库介绍

1、Apache POI是用于读写微软Office文件的Java库,最广泛也最好用;

2、PDF操作类库有pdfbox和openpdf,pdfbox兼容性更好,推荐使用;


pdfbox读取pdf示例:

PDDocument doc = PDDocument.load(new File("openssl-man.pdf"));
PDFTextStripper stripper = new PDFTextStripper();
System.out.println(stripper.getText(doc));

openpdf读取pdf示例:

PdfReader pdf = new PdfReader("openssl-man.pdf");
int cnt = pdf.getNumberOfPages();
System.out.println(cnt);
PdfTextExtractor extractor = new PdfTextExtractor(pdf);
String page = extractor.getTextFromPage(1);
System.out.println(page);

发表评论
评论通过审核之后才会显示。