Articles of parsing

使用awk或sed从ifconfigparsing数据?

我想parsing从sed的ifconfig输出的一些数据,但我不能够正确地做到这一点。 我想要命令提取我后面的数字。 例如,我有兴趣提取发送的字节: eth1 Link encap:Ethernet HWaddr 00:00:00:09:15:f7 inet addr:192.168.1.2 Bcast:192.168.1.255 Mask:255.255.255.0 inet6 addr: fe80::92e2:baff:fe08:35c7/64 Scope:Link UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:75141 errors:0 dropped:0 overruns:0 frame:0 TX packets:78046 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 txqueuelen:1000 RX bytes:9040489 (9.0 MB) TX bytes:34806464 (34.8 MB) 如果我使用sed: ifconfig eth1 | sed 's|.*RX bytes:\([0-9]*\).*|\1|g' 我得到这个输出: eth1 Link encap:Ethernet […]

在bash中parsingCSV并分配variables

我有一个csv的格式(在Linux上工作Bash) DN , MAC , Partition , 123 , abc , xyz 321 , asd , asd 我可以使用awkparsing它 eval MAC=($(awk -F "," '{print $1}' random.csv)) 这是为CSV中的每一列完成的,因此我可以单独调用DN[2] , MAC[2]等,这些是手动的,并且可以单独parsing它们。 但是,我怎么可以逐行parsingCSV? 例如:如果我要求DN是123 ,则还应该返回相应的MAC和Partition 。

用grepparsingstring

我需要一些在Linux中parsingstring的帮助。 我有一个string: [INFO] Total time: 2 minutes 8 seconds 只想得到 2 minutes 8 seconds

parsing文件perl

这个程序会将$ rf_id,$ date,$ qf_id和$ failure_msg打印到一个文件中,问题出在获取第一个值的时候,它将$ rf_id的值存储为0,其余的值是根据需要打印的。rf_id是sumhow正在设置为0只在其他行的第一行就好了。 #!/usr/bin/perl use strict; use warnings; my $mailqdir = "/mail1.txt"; my $mqueue_directory = "/var/spool/mqueue/"; my $messages_removed = 0; my $rf_id; my $date; my $temp; my $tmp; my @write_array; my $to; my $from; my $subject; my $path_to_sendmail = "/usr/sbin/sendmail -f"; my $mailsubject = "Subject: Deleted Queued Mails from LSMGR sendmail \n\n\n"; […]

parsingps'“etime”输出并将其转换为秒

这些是ps h -eo etime可能的输出格式 21-18:26:30 15:28:37 48:14 00:01 如何parsing他们到几秒钟? 请假定至less3位数的部分,因为我不知道多久可以。 输出将被egreped为只有一行,所以不需要循环。

从bash中的string中删除所有特殊字符和大小写

我正在写一个需要parsing文件名的bash脚本。 它将需要删除所有特殊字符(包括空格): “!?。_并将所有的大写字母改为小写,如下所示: Some_randoM data1-A More Data0 至: somerandomdata1a moredata0 我已经看到很多问题要在许多不同的编程语言中做到这一点,但不是在bash中。 有没有一个好的方法来做到这一点?

如何parsingnetstat命令以获取进程名称和PID?

我试图确定什么应用程序正在使用某个端口,并获得netstat -tlnp | grep <port> for Linux netstat -tlnp | grep <port> for Linux 。 该命令返回以下输出: (Not all processes could be identified, non-owned process info will not be shown, you would have to be root to see it all.) tcp 0 0 0.0.0.0:<port> 0.0.0.0:* LISTEN 3591/java 我只需要得到进程和PID的名字,即java 3591。 什么是最好的办法呢? 谢谢。

Maltparser在NLTK中给出错误

我的CODE是 from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World") 而错误是 Traceback (most recent call last): File "malt.py", line 13, in <module> print mp.raw_parse("Hello World") File "/usr/local/lib/python2.7/dist-packages/nltk/parse/malt.py", line 139, in raw_parse return self.parse(words, verbose) File "/usr/local/lib/python2.7/dist-packages/nltk/parse/malt.py", line 126, in parse return self.parse_sents([sentence], verbose)[0] File "/usr/local/lib/python2.7/dist-packages/nltk/parse/malt.py", line 114, in parse_sents return self.tagged_parse_sents(tagged_sentences, verbose) File "/usr/local/lib/python2.7/dist-packages/nltk/parse/malt.py", […]

使用awk来检查两个date之间

我有一个在其中有多个数据结构的文件,如下所示: eventTimestamp: 2010-03-23T07:56:19.166 result: Allowed protocol: SMS payload: RCOMM_SMS eventTimestamp: 2010-03-23T07:56:19.167 result: Allowed protocol: SMS payload: RCOMM_SMS eventTimestamp: 2010-03-23T07:56:19.186 result: Allowed protocol: SMS payload: SMS-MO-FSM eventTimestamp: 2010-03-23T07:56:19.197 result: Allowed protocol: SMS payload: COPS eventTimestamp: 2010-03-23T07:56:29.519 result: Blocked protocol: SMS payload: COPS type: URL_IWF result: Blocked 我想查找所有有效负载的事件:SMS-MO-FSM或负载:发生在时间之间的SMS-MO-FSM-INFO 2010-03-23 12:56:47和2010-03-23 13: 56:47。 在查询这个文件到目前为止,我已经在以下方式使用awk: cat checkThis.txt | awk […]

linux bash – 自定义格式的parsingdate

我有一个%c格式的date(可以是任何其他) ,我需要在date命令中使用它。 %c不是美国的格式。 这是德国的,因为它是德国的服务器。 这在美国服务器上也不能正常工作。 (设置为德语或美语的语言环境) 这不起作用(包括错误): user@server:~$ NOW=$(date +%c); echo $NOW Do 19 Dez 2013 22:33:28 CET user@server:~$ date –date="$NOW" +%d/%m/%Y date: ungültiges Datum „Do 19 Dez 2013 22:33:28 CET“ (date:ungültigesDatum“Do 19 Dez 2013 22:33:28 CET”= date: invalid date „Do 19 Dez 2013 22:33:28 CET“ ) 难点在于我不知道以后会使用哪种语言环境,甚至是什么格式,因为用户可以设置自己的格式。 所以一个简单的具体的parsing解决scheme并不是真正的工作! 但我该怎么做呢? 为了处理这个问题: 如果我有一个date格式format1 (可以是任何或至less一个可以颠倒),我可以使用date来获得格式化的date。 但是,如果我想格式化到另一个date( format2 […]