r语言 如何用最指数分布极大似然估计计的幂律分布

后使用快捷导航没有帐号?
查看: 5114|回复: 16
R语言最大能够处理多大量级的数据
中级会员, 积分 327, 距离下一级还需 173 积分
论坛徽章:8
因为要使用分析,十分想问一下,R语言一般针对什么样量级的数据进行分析,如果直接从数据库里边调用数据,一般多少比较合适
高级会员, 积分 584, 距离下一级还需 416 积分
论坛徽章:2
是啊,这个应该和机器配置有关系,但是也应该有个能够处理的量级。
高级会员, 积分 619, 距离下一级还需 381 积分
论坛徽章:9
同样问这个问题,一直想知道
金牌会员, 积分 1277, 距离下一级还需 1723 积分
论坛徽章:3
好问题。期待权威答案!
金牌会员, 积分 1017, 距离下一级还需 1983 积分
论坛徽章:5
我发现运行数据量庞大时 R其实很慢啊 配置有关?
同期待 有达人知道R的极限吗?
金牌会员, 积分 1057, 距离下一级还需 1943 积分
论坛徽章:1
几万条数据还是没问题的。再多就是慢呗,只和你内存有关,其实。
高级会员, 积分 597, 距离下一级还需 403 积分
论坛徽章:1
同求这个问题。。。。。
中级会员, 积分 488, 距离下一级还需 12 积分
论坛徽章:1
传说是都在内存中做处理……
高级会员, 积分 909, 距离下一级还需 91 积分
论坛徽章:3
中级会员, 积分 452, 距离下一级还需 48 积分
论坛徽章:1
同问,大数据的场景下,R适用吗
扫一扫加入本版微信群8370人阅读
R语言(1)
同济&概率论与数理统计& 习题 7.2
某厂晶体管寿命服从 E(lamda) 指数分布, Lamda未知, 且Lamda&0, 随机抽取样本寿命如下(小时)
518,612,713,388,434
用极大似然估计其平均寿命
构造似然函数
f &- function(lamda){
& &logL = n*log(lamda) - lamda*sum(x)
& &return (logL)
执行&optimize
x= c(518,612,713,388,434)
n = length(x)
optimize(f,c(0,1),maximum = TRUE)
& a = optimize(f,c(0,1),maximum = TRUE)
$objective
[1] -36.39261
平均寿命 =1/lamda
& 1/a$maximum
[1] 532.2862&
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:397442次
积分:5782
积分:5782
排名:第3521名
原创:174篇
评论:54条
(1)(1)(2)(1)(2)(1)(7)(1)(2)(6)(2)(2)(1)(1)(2)(10)(3)(1)(4)(8)(7)(1)(7)(3)(3)(7)(1)(2)(2)(4)(3)(2)(3)(5)(13)(1)(6)(6)(14)(28)(1)(2)(3)(3)R语言中演示最大似然法的小例子
已有 3264 次阅读
|个人分类:|系统分类:|关键词:R语言 演示 最大似然法 小例子
R语言中演示最大似然法的小例子
六盘水师范学院生物信息学实验室
在统计学中,通常我们观察的样本呈一定的分布。而各种分布都有自身的参数,调整这些参数值能得到最优的分布形态以拟合我们的样本分布。通常这种参数的调整,或者说找到最优的参数是用最大似然法实现的。利用参数的似然值方程,遍历参数的取值区间得到一个最大似然值,这个最大似然值对应的参数就是最优参数。下面我们就以指数分布来作些最基本的演示。
一个指数分布的是:
其中λ & 0是分布的一个参数,常被称为率参数(rate parameter)。指数分布的区间是[0,∞)。 如果一个X 呈指数分布,则可以写作:X ~ Exponential()。
因此指数分布中一个重要的参数就是λ,为了便于输入,下面我们将使用字母u来替代λ。
设一组样本为(x1,x2,……xn)服从指数分布,其对数似然值方程为
(u) = n log(u) − u∑(xi). 最大似然值得估计就是使得l(u)取得最大值得u估计。
首先把这个估计方程写成一个R语言函数
= function(x) {
sumx = sum(x)
= length(x)
function(mu) n * log(mu) - mu * sumx
函数名称为“Rmlfun”
= Rmlfun(1:10)
定义一个由1到10,10个正整数呈指数分布的区间
求u=3时的似然值
= Rmlfun(20:30)
定义一个区间在20到30之间的指数分布efun2
求u=3时的似然值
似然值小于efun(3)= -154.0139说明,区间1到10更符合参数u为3的指数分布,这是区间的最优估计
下面我们对u的最优值进行最优估计
chob=function(x){
for(i in 1:x) print(efun2(i))
在区间20到30上,输出u从1到x之间所有似然值
参数上限为10
输出u从1到10的似然值
可见u=1为最优参数值
转载本文请联系原作者获取授权,同时请注明本文来自熊荣川科学网博客。链接地址:
上一篇:下一篇:
当前推荐数:0
评论 ( 个评论)
扫一扫,分享此博文
作者的其他最新博文
热门博文导读
Powered by
Copyright &苹果/安卓/wp
积分 186, 距离下一级还需 74 积分
权限: 自定义头衔
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡下一级可获得
权限: 签名中使用图片
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
悲催签到天数: 2 天连续签到: 1 天[LV.1]初来乍到
本帖最后由 kizgel 于
10:02 编辑
现在有一些随机数据,我想看它和哪个已知的分布拟合的最好,其中,带指数截尾的幂律分布(power law with exponential cutoff)是其中一个,它的概率密度函数为:f(x;α,λ)=C*x^(−α)*exp(−λ*x)复制代码首先,我随机生成一些随机值来代替我的实际数据:
data &- rlnorm(,1.23)
h &- hist(data,breaks=1000,plot=FALSE)
x &- h$mids
y &- h$density复制代码然后,使用`nls`函数来进行参数评估:
nls(y~c*x^(-a)*exp(-b*x),start=list(a=1,b=1,c=1))复制代码进行到这里,总是会抛出两个错误中的其中一个:
1.奇异值矩阵;在网上搜索了,是初始值的原因的,尝试了几次,有时候能解决;
2.Error in numericDeriv(form[[3L]], names(ind), env) :& &在计算模型的时候产生了缺省值或无限值;尝试做过一些数据处理,但是这个问题一直无法解决;
对于这个参数估计的问题,我应该怎么求解,或者是否有更好的方法或者函数来实现带指数截尾的幂律分布的参数估计,先谢谢大家了
支持楼主:、
购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
载入中......
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
论坛法律顾问:王进律师

我要回帖

更多关于 r语言 幂律分布 的文章

 

随机推荐