24小时热门版块排行榜    

北京石油化工学院2026年研究生招生接收调剂公告
查看: 1684  |  回复: 9
【奖励】 本帖被评价2次,作者lhdcsu增加金币 1.5
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

lhdcsu

铁虫 (小有名气)


[资源] 化学计量学中的一些必备的统计学习基础(纯属个人感觉,请虫友指正)

             (纯属个人感觉,请虫友指正)
    化学计量学主要包括了采样理论,实验设计,信号处理,多元分辨与校正,定量结构活性研究(QSAR),模式识别及智能专家系统这几个部分。其中的QSAR及模式识别与统计学习方法密切相关,所以,对统计学习理论的一些基础的掌握应该是有必要的。
   最基本的概念莫过于随即变量的概率密度函数了。它反映了变量的在空间的分布状况,那些区域分布密集,那些区域分布稀疏,一旦某个变量的概率密度函数确定了,那么相应的很多问题就会被轻而易举的解决,问题就出在对变量的概率密度的估计是一件很难的事情,往往从经验数据中推测。常用的分布有正态分布,F分布,t分布,瑞利分布等等。可以这样讲,数据的分布是建立模型的根本。
   其次就是随机变量的数字特征,如期望值,方差。期望值就是加权平均,方差反映出数据变动的大小。我们通常说,某变量的方差越大,就蕴藏着越多的信息,方差为0的话,那就不能提供任何信息。所以,在化学计量学里面,方差可以看作是是衡量信息量的一个测度。举个例子,在主成分分析,偏最小二乘中,对主成分的提取就是
在潜变量的方差或协方差最大的方向上进行,因为这些方向上蕴藏的信息多,仅需几个潜变量就可提取出很丰富的信息,既降低了数据的维数,又不会丢失很多信息。
   相关系数:可以用来描述两个变量之间的线性相关程度。对于一个矩阵数据来说,变量之间的相关系数可以反映出变量之间信息重叠程度的大小,也能反映出矩阵的病态程度的大小。
   模型评价:在回归分析中,得到数学模型之后,往往会用一些参数来评价模型的质量,比如用复相关系数,均方误差,F值,交互检验值等。在模式识别中,用到错分率,交互检验值等。
   损失函数:一个模型的建立事实上可以看作对一个特定的目标函数的优化,这个目标函数通常就是损失函数,常用的损失函数有平方损失函数,0-1损失函数及用的比较少的指数损失函数(boosting)。据说统计学家都比较低调,喜欢比较低调的词语,如损失一词,呵呵。
   欠拟合与过拟合:我们喜欢一个合适的模型,在能够解释数据的情况下,模型越简单越好,不严格的讲,这就是奥柯姆剃刀原理。而事实上,我们建立的模型可能发生欠拟合(不能很好的解释数据)或者过拟合(把误差也给拟合了,泛化能力差)。这两种情况都不是我们所需要的,我们需要的是一个‘合适’的模型,怎么样才算合适呢?这一直是一个问题。  

附: 在Vapnik的《统计学习本质》这本书里面,他说机器学习包括三个部分:回归分析,模式识别及最根本的密度估计。
[search]化学计量学[/search]

[ Last edited by 佳怡 on 2009-4-23 at 21:33 ]
回复此楼

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yalefield

金虫 (文坛精英)


除了长春的许禄、天津南开的邵学广(原来在合肥)、湖南的吴海龙、上海的陆文聪、中南大学的梁逸增,还有谁的弟子这么关心化学计量学?真乃幸事。

从楼主大号lhdcsu猜,可能是中南大学的吧。
4楼2007-12-24 22:41:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

dnp

荣誉版主 (知名作家)


呵呵,沙发我坐了
这个专题的两个基础内容就完成了,期待大家的建议。
统计在化学计量学中一直都是一个非常重要的问题,因为我们并不能判断我们得出来的结果到底是好还是坏,拿拟和为例,一般认为拟和得越好就好,但是未必,如果过拟和的话,在模式识别中就会使得预测效果非常差。
因此,就需要非常多的东西来评价我们所得结果的好坏。
2楼2007-12-24 20:31:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

dnp

荣誉版主 (知名作家)


★★★★★ 五星级,优秀推荐

楼上好强啊,中南大学都被你给摸透了.
5楼2007-12-24 22:59:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

samtyty

铁杆木虫 (著名写手)


★★★ 三星级,支持鼓励

回yalefield:
本人不是您提到这些人的弟子,不过对中南大学的梁逸曾最熟悉,见过几次,其次是邵学广,开会的的时候见过一次。

本人一直是研究化学计量学的,不过没有什么原创的东西。
6楼2007-12-25 09:13:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
☆ 无星级 ★ 一星级 ★★★ 三星级 ★★★★★ 五星级
普通表情 高级回复 (可上传附件)
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考研] 一志愿9材料学硕297已过六级求调剂推荐 +9 adaie 2026-04-04 10/500 2026-04-05 11:19 by 风雨无晴
[考研] 材料与化工371求调剂 +8 陪琳看海 2026-04-04 8/400 2026-04-05 09:10 by guoweigw
[考研] 复试调剂 +10 呼呼?~+123456 2026-04-05 10/500 2026-04-05 08:59 by syjjj0321
[考研] 求生物学学硕调剂——364分 +7 云朵遛弯指南 2026-04-04 7/350 2026-04-04 22:49 by zhyzzh
[考研] 可跨专业调剂 +3 周的得地 2026-04-04 6/300 2026-04-04 22:21 by barlinike
[考研] 342求调剂 +3 Liang7111 2026-04-04 5/250 2026-04-04 19:47 by dongzh2009
[考研] 一志愿东北大学085901土木专硕345求调剂 +3 zxt11111 2026-04-04 3/150 2026-04-04 14:21 by 土木硕士招生
[考研] 考研调剂 +4 zybz冲冲冲 2026-04-03 6/300 2026-04-04 13:08 by zybz冲冲冲
[考研] 一志愿南昌大学324求调剂 +13 hanamiko 2026-04-01 13/650 2026-04-03 18:30 by ls刘帅
[考研] 农学考研求调剂 +3 dkdkxm 2026-04-01 3/150 2026-04-02 16:04 by wangjagri
[考研] 283求调剂 +3 jiouuu 2026-04-02 4/200 2026-04-02 14:08 by 哒哒哒呱呱呱
[考研] 085900土木水利336分求调剂 +4 Zhangjiangj 2026-03-31 6/300 2026-04-02 11:40 by 1753564080
[考研] 266求调剂 +4 学员97LZgn 2026-04-02 4/200 2026-04-02 09:52 by yulian1987
[考研] 一志愿北京科技,085601总分305求调剂 +9 半生瓜! 2026-04-01 11/550 2026-04-02 08:28 by Wang200018
[考研] 285求调剂 +11 AZMK 2026-04-01 11/550 2026-04-01 22:40 by peike
[考研] 材料与化工(0856)304求B区调剂 +8 邱gl 2026-03-30 16/800 2026-04-01 17:58 by 邱gl
[考研] 311求调剂 +10 李芷新1 2026-03-31 10/500 2026-04-01 14:38 by chenqifeng666
[考研] 一志愿北交材料工程总分358 +5 cs0106 2026-04-01 7/350 2026-04-01 11:45 by wangjy2002
[考研] 085404 22408 315分 +5 zhuangyan123 2026-03-31 6/300 2026-03-31 13:48 by limeifeng
[考研] 福建理工大学材料学院先进合金团队招收考研调剂学生 +3 大华金商都 2026-03-30 4/200 2026-03-31 01:04 by 方英俊602
信息提示
请填处理意见