如何使用sed删除非ASCII字符

我想从某个文件中删除非ASCII字符。你能帮我找出正确的方法来做到这一点。

我已经尝试了很多正则expression式。

sed -e 's/[\d00-\d128]//g' (not working) cat /bin/mkdir| sed -e 's/[\x00-\x7F]//g' >/tmp/aa but this aa file contains some non-ascii chars. [root@asssdsada ~]$ hexdump /tmp/aa|more 00 01 02 03 04 05 06 07 - 08 09 0A 0B 0C 0D 0E 0F 0123456789ABCDEF 00000000 45 4C 46 B0 F0 73 38 C0 - C0 BC BC FF FF 61 61 61 ELF..s8......aaa 00000010 A0 A0 50 E5 74 64 50 57 - 50 57 50 57 D4 D4 51 E5 ..P.tdPWPWPW..Q. 00000020 74 64 6C 69 62 36 34 6C - 64 6C 69 6E 75 78 78 38 tdlib64ldlinuxx8 00000030 36 36 34 73 6F 32 47 4E - 55 42 C8 C0 80 70 69 42 664so2GNUB...piB 00000040 44 47 BA E3 92 43 45 D5 - EC 46 E4 DE D8 71 58 B9 DG...CE..F...qX. 00000050 8D F1 EA D3 EF 4B 86 FC - A9 DA 79 ED 63 B5 51 92 .....K....ycQ 00000060 BA 6C FC D1 69 78 30 ED - 74 F1 73 95 CC 85 D2 46 .l..ix0.ts...F 00000070 A5 B4 6C 67 DA 4A E9 9A - 4B 58 77 A4 37 80 C0 4F ..lg.J..KXw.7..O 00000080 F3 E9 B2 77 65 97 74 F9 - A2 C0 F2 CC 4A 9C 58 A1 ...we.t.....JX

这似乎不适用于sed 。也许tr会做？

 tr -d '\200-\377'

或者与补充：

 tr -cd '\000-\177'

你试过了吗

 cat /bin/mkdir | tr -cd "[:print:]"

我认为它解决了这个问题？

如果只有文字内容感兴趣，你也可以使用

 cat /bin/mkdir | strings

你知道目前使用什么编码文件？如果是这样，你可以使用iconv来转换它。这是一种从一种字符编码转换为另一种字符的实用工具。所以，如果原始文件是UTF-8，并且您想要转换为ASCII，则可以使用以下内容：

 iconv -f utf8 -t ascii <inputfile>

输入文件上的文件命令可能会告诉你当前的编码。

有趣的是，有一个名为enca的命令，如果知道文件内容的语言，它将尽其所能确定正在使用的字符编码。

这个问题可能是答案。

尝试使用sed -i选项，例如。

 sed -i 's/[\d128-\d255]//g' MYFILE.txt

它会替换文件中的所有非ASCII字符。