Skip to content
Projects
Groups
Snippets
Help
Loading...
Help
Submit feedback
Contribute to GitLab
Sign in
Toggle navigation
P
pdf-miner
Project
Project
Details
Activity
Releases
Cycle Analytics
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
Issues
0
Issues
0
List
Board
Labels
Milestones
Merge Requests
0
Merge Requests
0
CI / CD
CI / CD
Pipelines
Jobs
Schedules
Charts
Wiki
Wiki
Snippets
Snippets
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Charts
Create a new issue
Jobs
Commits
Issue Boards
Open sidebar
Qin Kaijie
pdf-miner
Commits
7d551635
Commit
7d551635
authored
Jul 30, 2024
by
xuchao
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
modify readme, make expression more clear
parent
f055d955
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
6 additions
and
6 deletions
+6
-6
README_zh-CN_v2.md
README_zh-CN_v2.md
+6
-6
No files found.
README_zh-CN_v2.md
View file @
7d551635
...
@@ -54,7 +54,7 @@
...
@@ -54,7 +54,7 @@
<li><a
href=
"#使用gpu"
>
使用GPU
</a></li>
<li><a
href=
"#使用gpu"
>
使用GPU
</a></li>
</ul>
</ul>
</li>
</li>
<li><a
href=
"#使用"
>
使用
</a>
<li><a
href=
"#使用"
>
使用
方式
</a>
<ul>
<ul>
<li><a
href=
"#命令行"
>
命令行
</a></li>
<li><a
href=
"#命令行"
>
命令行
</a></li>
<li><a
href=
"#api"
>
API
</a></li>
<li><a
href=
"#api"
>
API
</a></li>
...
@@ -82,13 +82,13 @@
...
@@ -82,13 +82,13 @@
# MinerU
# MinerU
## 项目简介
## 项目简介
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。
MinerU诞生于
[
书生-浦语
](
https://github.com/InternLM/InternLM
)
的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,以此在大模型时代为
推动科技的
发展做出一点贡献。
MinerU诞生于
[
书生-浦语
](
https://github.com/InternLM/InternLM
)
的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,以此在大模型时代为
科技
发展做出一点贡献。
## 主要功能
## 主要功能
-
删除页眉、页脚、脚注、页码等元素,保持语义连贯
-
删除页眉、页脚、脚注、页码等元素,保持语义连贯
-
符合人类阅读顺序的排版格式
-
对多栏输出符合人类阅读顺序的文本
-
保留原文档的结构
和格式
,包括标题、段落、列表等
-
保留原文档的结构,包括标题、段落、列表等
-
提取图像、图片标题、表格、表格标题
-
提取图像、图片标题、表格、表格标题
-
自动识别文档中的公式并将公式转换成latex
-
自动识别文档中的公式并将公式转换成latex
-
乱码PDF自动检测并启用OCR
-
乱码PDF自动检测并启用OCR
...
@@ -98,8 +98,8 @@ MinerU诞生于[书生-浦语](https://github.com/InternLM/InternLM)的预训练
...
@@ -98,8 +98,8 @@ MinerU诞生于[书生-浦语](https://github.com/InternLM/InternLM)的预训练
## 快速开始
## 快速开始
如果遇到任何
问题,请先查询
<a
href=
"#faq"
>
FAQ
</a>
</br>
如果遇到任何
安装问题,请先查询
<a
href=
"#faq"
>
FAQ
</a>
</br>
如果遇到
效果不及预期,查询
<a
href=
"#known-issue"
>
Known Issue
</a></br>
如果遇到
解析效果不及预期,参考
<a
href=
"#known-issue"
>
Known Issue
</a></br>
有3种不同方式可以体验MinerU的效果:
有3种不同方式可以体验MinerU的效果:
-
在线体验
-
在线体验
-
使用CPU快速体验(Windows,Linux,Mac)
-
使用CPU快速体验(Windows,Linux,Mac)
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment