百度文库下载工具(百度文档),是由网友开发的一款能够下载百度文库资源的工具,支持doc、ppt文件下载,只能撷取doc文章中的文字部分,PPT下载后只是图片格式,软件还在不断更新中!
当前可以做到的是:
1:仅仅支持DOC格式,虽然pdf,txt格式不难,但是还没有时间去做。
2:这个工具可以做到的就是doc文件格式文本下载,字体,颜色,段落基本上都是正确的。
3:目前只能撷取doc文章中的文字部分,图片部分当前还没有完成,已经有思路了,技术上是可行的,回头我再想想怎么整合到代码里面去。
当前实现功能
1:doc格式可以下载,可以识别部分:
1.1:硬回车换行,基本可以正常识别。
1.2:表格中偶尔有硬回车,基本可以识别。
1.3:软回车,基本可以识别
2:文字应该不会有错别字,因为不是用pdf扫描识别做的。
更新到版本0.95
主要更新内容:
1:支持ppt下载,不过百度返回的ppt是图片,不是源文件,PPT下载后只是图片格式,不是源文件,这个真的没办法。不过如果只是把PPT下载下来播放,不需要太多修改的,用这个也就够了。
2:大家提出意见希望可以支持选择文件下载路径,一起修改上去了。