Articles of 文本

从文本文件中获取nu.nl的新闻标题

我想在文本文件中有nu.nl的新闻标题,以便我可以在我的bash脚本中使用它们。 我也想用bash脚本来提取这些标题。 我今天添加了nu.nl主页的屏幕截图( http://img.zgserver.com/linux/gS2mp.png )。 例如,我想在一个文本文件中: "Ook met Grieks referendum houdt Eurogroep vandaag nog overleg <br/> Koeweit pakt verdachten van aanslag op <br/> Ruim 4 op de 5 boetes voor te hard rijden <br/> … et cetera" 我正在Ubuntu 14.04.2 LTS上编程bash脚本(GNU / Linux 3.16.0-41-generic x86_64)

select一个文件的一部分,并将其复制到Linux中的新文件

如何使用Linux将文件的特定内容复制到新文件中? 例如,我有一个名为test.log文件的文件,它包含大约1000行。 从这1000行我需要复制200 – 700行之间的行。 LINUX / UNIX中是否有单行命令?

如何使用BASH比较两个文本文件的相同的确切文字?

比方说,我有两个文本文件,我需要从中提取数据。 这两个文件的文本如下: 文件1: 1name – randomemail@email.com 2Name – superrandomemail@email.com 3Name – 123random@email.com 4Name – random123@email.com 文件2: email.com email.com email.com anotherwebsite.com 文件2是文件1的域名列表,从电子邮件地址中提取。 这些域名无论如何都是不一样的,而且是相当随意的。 我怎样才能得到与文件1中的文件2匹配的域名的结果? 先谢谢你!

用Perl / AWK将两个连续的行合并成一行

我有如下的数据: abcd join abcd efgh join efgh 我想连续两个连成一条线。 导致: abcd join abcd efgh join efgh 我怎样才能在Perl / AWK中做到这一点?

使用sed删除文本文件中的所有前导/后续空格

文件1: hello world 如何使用sed删除这个文件中的前/后空格 – 使用一个命令(没有中间文件) ? 我目前得到: sed -e 's/^[ \t]*//' a > b 领先的空间。 sed 's/ *$//' b > c 而这为尾随空间。

search并replacelinux目录的所有文件中的文本

我有一个网站目录,我需要将所有硬编码链接从一个域更改到另一个域。 寻找一个单一的(grep?sed?)bash命令,可以让我改变目录中所有文件中的所有文本。

如何将ISO8859-15转换为UTF8?

我有一个ISO8859-15编码的阿拉伯文件。 我怎样才能把它转换成UTF8? 我用iconv但它不适合我。 iconv -f ISO-8859-15 -t UTF-8 Myfile.txt 我想附上文件,但我不知道如何。

如何编辑300 GB的文本文件(基因组数据)?

我有一个300 GB的文本文件,其中包含超过25万条logging的基因组数据。 有一些logging数据不好,我们的基因组程序“Popoolution”允许我们用星号注释掉“坏”logging。 我们的问题是,我们找不到一个文本编辑器来加载数据,以便我们可以注释掉不良logging。 有什么build议么? 我们有Windows和Linux的盒子。 更新:更多信息 Popoolution( https://code.google.com/p/popoolation/ )程序在达到“坏”logging时崩溃,并给出我们可以注释的行号。 具体来说,我们从Perl那里得到一个消息:“F#€%&Scaffolding”。 手册build议我们可以用星号来表示不好的一行。 可悲的是,我们将不得不多次重复这个过程。 还有一个想法…是否有一种方法可以让我们在不打开整个文本文件的情况下将星号添加到行中。 这可能是非常有用的,因为我们将不得不重复这个过程未知的次数。

帮助编写批处理脚本来parsingCSV文件并输出文本文件

我正在努力编写一个可以读取CSV文件的批处理脚本,如下所示 Name:, City:, Country: Mark, London, UK Ben, Paris, France Tom, Athens, Greece CSV文件中会有一个标题行。 它应该输出到一个文本文件如下: Name:Mark City:London Country:UK Name:Ben City:Paris Country:France Name:Tom City:Athens Country:Greece 上述输出中的字段分隔符(:)预计将在标题行本身中提供。 所以我需要做的是连接字段标题和它的值。 此CSV文件中的列数不固定,因此脚本不应限制为3个标记。 请帮助!

在Windows中修剪文本文件末尾的多余pipe道

所以基本上我有一个输出一个文本文件的pipe道分隔的过程,看起来像这样: |abc123|1*|004|**gobbligook|001|%|2014-01-01||||||||||||| 这只是一个例子,我不确定答案是否涉及正则expression式。 如果是这样,我会把实际的行。 无论如何 问题 所以对于这个例子来说,接受这个文件的导入过程是寻找8个pipe道,但是如果在8个导入过程失败之后再看到更多的pipe道,那么就有20个pipe道。 题 是否有一个过程,我可以在Windows环境中使用修剪整个文件的结尾尾随pipe道? UPDATE Magoo给了我一个很好的答案,我正在工作,但我一直得到这个错误:在这个时候定界符是意外的 这是代码: @ECHO OFF SETLOCAL SET "sourcedir=C:\Users\Desktop\Pipe Delimiter Project" SET "destdir=C:\Users\Desktop\Pipe Delimiter Project" ( FOR /f "tokens=1-7delims=|" %%a IN ('TYPE "%sourcedir%\test.txt"') DO ( ECHO(^|%%a^|%%b^|%%c^|%%d^|%%e^|%%f^|%%g^| ) )>%destdir%\newfile.txt 任何人都知道什么是错的? 我也只是从问题| abc123 | .. |放行 像6次粘贴在文件中…谢谢!