Articles of pdf

蜡染:在Linux上的svg到pdf(没有X服务器)

与将SVG转换为PDF的方法相似,svg2pdf转换在Windows下成功运行,文本项目可在search结果中search。 它在linux(Ubuntu)下生成pdfs(使用-Djava.awt.headless = true来避免由于缺lessX11窗口服务器而导致的exception),但是文本项不可search,有时甚至被编码为图像。 是否有可能在Linux下保存PDF文本,我错过了一些运行时选项? UPD:我可以以某种方式强制蜡染(SVGGraphics2D或SVGConverter)回退到默认字体,如果某些字体没有find?

Java:字体在Linux上看起来乱码,但在Windows上很好

我正在写一个Java应用程序呈现PDF文件的图像,当我在Windows上运行它工作正常。 但是,当我在Linux上渲染PDF时,标准字体看起来有点乱码,就像在某些字符的右侧会有几个像素丢失一样。 我只用OpenJDK 6的全新安装Ubuntu 9.04进行了testing,但是我确定在Linux上看到过类似的问题。 我也尝试使用其他Java PDF应用程序打开PDF,例如SwingLabs PDFRenderer和IcePDF Demo Applet,它们也有同样的问题。 在窗户上,他们都呈现文件就好了。 我也用默认的PDF查看器evince在同一台Ubuntu机器上打开了文档。 Evince呈现的文件没有字体问题,所以我很确定这是一个普通的Java + Linux问题。 为了比较: 此图像在Windows上呈现。 此图像在Linux上呈现。 我用红圈标出了一些乱码。 这个也是在Linux上渲染的。 看起来只有标准字体受到影响。 任何帮助表示赞赏。

如何将多个PDF页面连接到一个页面

我有一个4页的PDF。 我想创build另一个PDF页面在一个接一个(垂直alignment)在一个页面中定位。 哪个命令行工具可以用于那个?

阅读,突出显示,以编程方式保存PDF

我想写一个小脚本(它将运行在无头的Linux服务器上),读取PDF,突出显示与我传递的string数组中的任何内容匹配的文本,然后保存修改过的PDF。 我想我最终会使用像python绑定到poppler的东西,但不幸的是有接近零的文档,我有python旁边的零经验。 如果任何人可以指向我的教程,例子,或一些有用的文件,让我开始这将不胜感激!

缩放pdf以添加边框以打印全尺寸页面

打印没有边框(或页边距)的PDF时,打印机将在纸张的边缘切除大约1毫米的图像数据。 因此,我正在寻找一种解决scheme来在页面上稍微缩放/调整一个pdf页面的大小,以便在与打印机生成的边缘上的空白对应的边缘处添加一个白色边框。 我已经尝试使用gs到目前为止..例如,假设我有一个A4大小的pdf 1.pdf ,然后我用: gs -sDEVICE=pdfwrite \ -q -dBATCH -dNOPAUSE \ -dPDFFitPage \ -r300x300 \ -g2232x3157 \ -sOutputFile=1A.pdf \ 1.pdf 在这里,一个完整的A4文件是由-g2480x3508给出的,我试图乘以0.9乘以比例,但是我没有看到这个效果。

在ICC中embeddedICC颜色configuration文件

我正在生成PDF,其中所有graphics都在sRGB色彩空间的\ DeviceRGB中绘制。 我想使用ICCconfiguration文件将PDF转换为不同的颜色configuration文件,并embeddedICCconfiguration文件,但我找不到一个好的工具来做到这一点。 我曾尝试ImageMagick,但是光栅化PDF是不受欢迎的,我尝试过使用Ghostscript。 但是,虽然这转换颜色,它不embeddedICCconfiguration文件。 有什么工具或库(最好Java或Scala)可用于Linux,做我想要的? 我试过的Ghostscript命令是: gs -o cmyk.pdf -sColorConversionStrategy=CMYK -sDEVICE=pdfwrite \ -dOverrideICC=true -sOutputICCProfile=CoatedFOGRA27.icc \ -dRenderIntent=3 in.pdf 和 gs -dSAFER -dBATCH -dNOPAUSE -sDEVICE=pdfwrite -ColorConversionStrategy=CMYK \ -dProcessColorModel=/DeviceCMYK -sOutputICCProfile=CoatedFOGRA27.icc \ -sOutputFile=cmyk.pdf in.pdf 和以上的几个变化。 我已经尝试了Ghostscript版本9.10和9.16。

开源OCR

我正在寻找在Linux上运行的开源OCR库。 我需要这个工作PNG和PDF。 大多数情况下,我想从Java或ruby接口这个库。 任何想法,如果有什么可用的? 问候。

将多页PDF转换为单个图像

我必须将多页PDF文档转换为.png图像。 我尝试与ImageMagick,但我不能达到最终结果: convert document.pdf document.png 要么 convert -adjoin document.pdf document.png 这个命令创buildN个图像.png(其中N =文档页数): document0.png document1.png …. document(N-1).png 如果可能的话,我需要一个命令来获取单个图像。

如何从docbook 5.0生成pdf

我已经用头文件写了一个docbook 5.0文档: <?xml version="1.0" encoding="UTF-8"?> <book version="5.0" xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xi="http://www.w3.org/2001/XInclude" xmlns:svg="http://www.w3.org/2000/svg" xmlns:m="http://www.w3.org/1998/Math/MathML" xmlns:html="http://www.w3.org/1999/xhtml" xmlns:db="http://docbook.org/ns/docbook"> 和Ubuntu 9.10 docbook2pdf打印许多错误消息,并没有做任何PDF文件。 错误是: openjade:test.xml:2:0:E: prolog can't be omitted unless CONCUR NO and LINK EXPLICIT NO and either IMPLYDEF ELEMENT YES or IMPLYDEF DOCTYPE YES openjade:test.xml:2:0:E: no document type declaration; will parse without validation openjade:/usr/share/sgml/docbook/stylesheet/dsssl/modular/print/dbtitle.dsl:18:5:E: flow objects at the root must […]

一个轻松的解决scheme,在Linux中将文本转换为pdf

我正在寻找一个轻量级的解决scheme,在字面上将*.txt文件转换为pdf格式。 我希望解决scheme满足: 轻巧。 我知道重命名*.txt到*.odt ,然后使用libreoffice是一个途径,但它会加载沉重的libreoffice 。 我知道pr|groff -Tpdf是一个解决scheme,但它并没有真正的工作:它抛弃了我的换行符,可能会不小心把一些特殊的标记当作逃脱的标签,从而产生潜在的错误。 但是我仍然希望尽可能地使用这些旧的工具,因为它们稳定而快速。 非常感谢!