Intereting Posts

Unix和Linux真实文件中的'dot'和'dot dot'文件是什么？发送调制解调器AT命令和parsing结果 mod_rewrite与子域和url模式如何在JAVA中运行Windows命令并将结果文本作为string返回在Windows中运行Eclipse C ++中的Hello World应用程序 Ruby：Windowspath转换如何找出何时CancelIo（）完成？如何在PF_UNIX套接字的服务器端打印客户端sun_paths名称？使用Cabal，haskell来源安装unix-2.7.0.1包 Linux fork（）和wait（）如何在nginx访问日志中不logging获取请求参数？我在哪里可以findkernel32.dll支持的api？ Windows中的基本NTP客户端在Visual C ++中如何创build一个没有父目录在Linuxpath的软链接？我怎样才能SSH窗口中运行cygwin / sshd和terminal会话使用cygwin而不是默认的BASH？

阅读PDF与C

我希望能够阅读PDF文件的内容。我需要在Linux上使用C来做到这一点。

我能接近这个在这里，但我认为Haru只能创buildpdf，不能读取它们（不是100％肯定）。

PS：我只需要PDF格式的纯文本

检查libpoppler 。我从来没有用它来提取文本，只是查询PDF属性。这很容易使用。

你需要解析它们多好？只是提取字符串应该是相对容易的，完全准确的渲染是困难的。看看evince或ghostscript的源代码？

这是为C ++，但可能是理解PDF结构的一个很好的起点http://www.codeproject.com/KB/cpp/ExtractPDFText.aspx （对不起，错误的链接之前）

另一个可能的，但我从来没有使用它是VersyPDF。它声称允许你编辑PDF文件… http://versypdf.sybrex-systems-ltd.qarchive.org/