在Windows 7下64位R的优化问题

我目前正处于开发我的第一个R包的最后阶段,它应该适合多项处理树(MPT)模型(参见当前版本的主页 )。 R的optim函数实现了模型拟合。
今天我第一次在Windows 7机器上玩了一下,发现了一些非常奇怪的东西:在使用64位版本的R时, optim不会成功地收敛。这看起来像是一个bug(尤其是当nlminb收敛于R版本)。 由于optim是我的软件包的核心,在这个问题上的任何帮助,不胜感激。

这里有一个最小可重现的例子(通常模型是通过expression式指定的,而不是在目标函数中指定的,但为了简单起见,我把所有的东西放在目标函数中):

 # The objective function: llk.tree <- function (Q, data) { p <- Q[1] q <- Q[2] r <- Q[3] e <- rep(NA,4) e[1] <- p * q * r e[2] <- p * q * (1-r) e[3] <- p * (1-q) * r e[4] <- p * (1-q) * (1-r) + (1-p) llk <- sum(data * log(e)) if (is.na(llk)) llk <- -1e+19 if (llk == -Inf) llk <- -1e+19 return(-llk) } # The call to optim: optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3)) 

这个例子再现了Riefer&Batchelder在MPT上的开创性论文的一个例子,即表1中的第1行。 327(期望的参数值将是p = 1,q = .49和r = .30)。

在32位R上运行它总是给出正确的结果(使用版本2.12.2和2.13.0):

 $par [1] 1.0000000 0.4944449 0.3000001 $value [1] 234.7110 $counts function gradient 11 11 $convergence [1] 0 $message [1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH" 

(请注意,由于随机起始值,计数可能会有所不同。)

另一方面在64位R上运行它可能会产生这样一个(错误的)结果:

 $par [1] 0.8668081 0.6326655 0.1433857 $value [1] 257.7328 $counts function gradient 3 3 $convergence [1] 0 $message [1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH" 

目标函数的返回值和返回的参数值在每次运行中都不相同,但count总是3!

请注意,运行nlminb会在32位和64位R上产生正确的结果:

 nlminb(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), lower = 0, upper = 1) $par [1] 1.0000000 0.4944445 0.3000000 $objective [1] 234.711 $convergence [1] 0 $iterations [1] 14 $evaluations function gradient 19 55 $message [1] "relative convergence (4)" 

最后一个注意事项:我们有一个例子(这是我们最简单的例子模型)在64位R上工作,并且optim但是更多的例子(如这里所示的例子)没有工作。

而伯爵总是3 …

编辑:

当确定起始值(感谢Joshua Ulrich)时, optim不会从64位R下的那些固定值移开:

 optim(c(0.5, 0.5, 0.5), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3)) $par [1] 0.5 0.5 0.5 $value [1] 276.1238 $counts function gradient 3 3 $convergence [1] 0 $message [1] "CONVERGENCE: REL_REDUCTION_OF_F <= FACTR*EPSMCH" 

我们今天做了一些更多的测试,并发现了与使用64位R的Linux下的问题中所描述的相同的问题。

不过,感谢Joachim Vandekerckhove这个巧妙的想法,我们尝试了一个简单的改变来解决问题(尽管问题仍然存在)。 在目标函数结束时,如果llkInf我们将其设置为非常高的值(是1e19 )。
使用较小的值(例如1e10 )可以消除64位机器上的问题(迄今在Linux上测试过):

 llk.tree <- function (Q, data) { p <- Q[1] q <- Q[2] r <- Q[3] e <- rep(NA,4) e[1] <- p * q * r e[2] <- p * q * (1-r) e[3] <- p * (1-q) * r e[4] <- p * (1-q) * (1-r) + (1-p) llk <- sum(data * log(e)) if (is.na(llk)) llk <- -1e+10 if (llk == -Inf) llk <- -1e+10 return(-llk) } # The call to optim: optim(runif(3, 0.1, 0.9), llk.tree, data = c(24, 65, 30, 61), method = "L-BFGS-B", lower = rep(0, 3), upper = rep(1, 3)) 

这将返回正确的结果!