24小时热门版块排行榜    

CyRhmU.jpeg
查看: 517  |  回复: 0

我是燎原星火

木虫 (小有名气)

[交流] 自己的体会,不知对不对,欢迎各位大神指正

概率密度函数f(x)在x处的值,恰好是随机变量落在区间[x,x+deltax]上的概率与区间长度之比的极限;注意!:概率密度函数f(x)在a处的值,并不代表事件{X=a}的概率;而随机变量X位于区间[x,x+deltax]的概率可以表示为P{x<=X<=x+deltax}=f(x)*deltax;其意义与离散型随机变量中p{X=x}类似;而约定连续型随机变量去取任意指定值的概率为0;

积分的本质就是累加和的极限,但是需要注意每一项对应的都是一个乘积;
而累加并不等同于积分;应当先把累加化为函数值与无穷小乘积的累加的形式才可以进一步化为定积分;

另一方面,定积分的实质就是累积效应;比较直观的累积一个是时间上的累积,一个是空间上的累积;例如速度在时间上的累积可以得到路程,即是对 的累积,再如力沿着某一路径做功,即是对 的累积;所以在考虑是否用积分表示时,一定事先考虑一下:什么量在什么尺度上的累积最后又得到什么量。

此外,上面有关概率密度函数的说法没有错,某一点处的函数值并不代表对应事件的概率值,可以说是对应的概率密度值,正如“线密度—位置”关系中,位置x处的函数值并不表示该点的质量一样,该点的质量应该为0,因为点的拓扑维数是0,可以说是改点的线密度值,仔细思考下可以理解这句话的意思:线密度其实是一个邻域的概念,也就是说线密度的意思是该点附近某一小邻域的平均密度值;

然后来仔细审视一下概率密度函数的来龙去脉以及他的抽象意义。概率密度函数是怎么计算的呢?他是频率直方图无限细化得到的;首先是划分区间,然后统计了落在每个区间内的样本数与总数的比值——频率,然后做出直方图;直方图得到的就是落在某区间的概率值,而经过细化得到的不是概率值而是概率密度值;然后再看看随机变量的分布函数,其本身实质上是一个累加和,他是概率密度函数在随机变量取值轴上的积分计算得到的;将这个问题抽象一下,假设现在有两个量Y,X,已知二者之间存在某种统计规律;因为要探索这种规律我们只能通过离散的方法,也就是X的取值不可能是连续的,这样通过取样就会得到一系列样本(X1,Y1)(X2,Y2)(X3,Y3)…(XN,YN),
同样,我们可以将X所在范围划分为等距区间,然后将落入每个区间的样本的Y值取个均值作为直方图的纵坐标[其实大家会反驳或者意识到,我们通常会直接做折线图或者散点来探索二元变量之间的关系,其实二者在某种意义上是等价的],然后作直方图;这样随着取样个数逐渐增多,直方图越来越细最终可以拟合一条直线;那么我想问的是:这条曲线可以叫作Y对X的密度曲线?如果要计算X<=x的Y值,可以对得到的这条曲线做类似积分么?
回复此楼
不要浮躁
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

智能机器人

Robot (super robot)

我们都爱小木虫

找到一些相关的精华帖子,希望有用哦~

科研从小木虫开始,人人为我,我为人人
相关版块跳转 我要订阅楼主 我是燎原星火 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见