最近很火的在线文件预览txt、doc、ppt、pdf、excel、jpg、mp4、png、zip、tar.gz等各种文件及压缩文件在线解压和预览,包括前后端设计和源码,编写一个文件搜索引擎实现多关键词检索,标记文件名称和文件内容内容(四)。
主要功能:
1、大文件超大文件上传、文件下载、断点续传、秒传、提速、限速;
2、压缩文件自动识别不同格式进行解压;
3、前后端传输编码规范;
4、非压缩文件实现自动在线预览;
5、文件内容读取、分析、计算、索引;
6、实现一个搜索引擎根据多个关键字对文件名称以及上传时间进行检索;
7、实现一个搜索引擎根据多个关键字对文件内容以及上传时间进行检索;
8、自动标记检索关键词在原文件名称和内容的位置;
9、在线预览文件包含:各类各种格式的图片、office各类办公文档、文本文档、视频文档、音频文档等等;
10、仿云盘文件存储的一些其他功能;
11、…………
前面的实现参考发布的该专栏的系列文章都有详细的说明,这里主要讨论第5步如何实现文件的具体内容读取、分析、计算、索引。
5、文件内容读取、分析、计算、索引;
6、实现一个搜索引擎根据多个关键字对文件名称以及上传时间进行检索;
7、实现一个搜索引擎根据多个关键字对文件内容以及上传时间进行检索;
通过前面的分析和实现,已经可以把绝大多数文档类的文件转换为html格式的文本文件,可以实现文件的 格式转换、在线预览、文件下载等等。
本章主要致力于搭建数据存储集群,对文本数据进行读取后存储,建立数据索引,为后面的文件内容搜索
最近很火的在线文件预览txt doc ppt pdf excel jpg png zip tar.gz等各种文件及压缩文件在线解压和预览 包括前后端设计和源码 编写搜索引擎多关键词检索名称和内容(四)