机器学习algorithm可以检测数字序列的随机性吗?

这里的随机性意味着伪随机性,就像Linux的随机数生成器一样。 例如,我有100-1000个数组,每个数组包含由Linux伪随机数生成器生成的10000个随机整数。 现在给出一个新的整数序列,如果像分类或聚类这样的机器学习algorithm能够检测这个整数序列是否是像以前的训练数据那样的伪随机数序列?

出于某种原因,我并不关心给定序列的实际随机性,我只想知道这个给定的序列是否由某个特定的linux伪随机整数生成器生成。 假设Linux RNG确实有一个归纳函数来产生一个伪随机整数序列,那么我们是否可以根据这个RNG产生的现有随机序列来预测现有的整数序列是否是由这个RNG产生的呢?

这是人们问的传统问题。 有关经典分析,请参阅Donald Knuth的“艺术计算机编程”第2卷 – “数学算法”。

如果您需要更多最先进的测试,可以在http://csrc.nist.gov/groups/ST/toolkit/rng/index.html找到一个软件套件,其中还包含大量的文档。

您也可以考虑阅读维基百科页面: http : //en.wikipedia.org/wiki/Statistical_randomness,以获得该领域的介绍性概念。