24小时热门版块排行榜    

查看: 1084  |  回复: 7
【奖励】 本帖被评价6次,作者clqxyz增加金币 3
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

clqxyz

木虫 (著名写手)


[资源] CAS编号详解,学化学的都要知道的知识

CAS编号详解
CAS: chemical abstract service Register number.
查询的网站有好多,一般使用google,输入物质名 和CAS就行了。  
美国化学摘要服务社( Chemical Abstracts Service)
CAS 是一个由科学家组成的团队,它为科学研究和探索创造并提供最完整有效的数字信息环境。
如何利用化学命名/分子式/结构式来检索化学文献
一、 前言
享有『世界化学文献之钥』美名的化学摘要,它是由美国化学摘要服务社( Chemical Abstracts Service, CAS)所出版的,其在化学化工文献上的贡献地位是不容忽视的。同时CAS也因应潮流所需,另外研发了一套STN线上检索系统,这套检索系统包括了200多种型型色色的数据库,在众多的数据库中,其最大的卖点在于它有一个独门的数据库─REGISTRY FILE,这个数据库的特色就在于它是一个强大的化学字典数据库,它可以利用化学命名、化学分子式和化学结构式来检索化学领域相关的资料,若再配合STN线上其它的数据库,则不论寻找参考文献、专利、化学物质物化性、化学物质注册或商情资料都能无往不利。

二、 关于REGISTRY FILE
由CAS所研发出的STN线上检索系统中,REGISTRY FILE为其最独特的数据库,而其特色在于它具有化学字典功能的特性,为一含以化学物质来辨识进而收集资料的数据库。REGISTRY FILE收录了1,600万的化学物质,其中包含了2,000万以上的化学品名称,同时它可以以化学名称、化学分子式或结构式来检索资料,它更提供了一强有力的化学物质登录号(CAS Registry number, CAS RNs),以做为查询复杂化学物质的独特且具权威的入门。先来介绍什么是CAS RNs,它对化学物质而言,好象是化学物质的身份证字号一样,为唯一且特定的一种编号,每一种化合物都可能有很多种不同的命名,以一般IUPAC命名的4,4’-sulfonyldianiline为例、它的商品名为Avlosulfon、而它的实验名为NSC 6091、进而CA索引命名为Benzenamine,4,4’-sulfonyl bis- 、至于其它的命名又如:1,1’-sulfonylbis﹝4-aminobenzene﹞等,在如此繁多的命名中,若以单一的命名来查询资料,势必会造成资料收集不全的困扰,但以这个例子来看,其化学物质登录号为【80-08-0】,以这唯一的信息来检索资料,可节省许多精力与时间,同时资料也会收集较齐全。而CAS RNs不仅只出现在由CAS出版的书籍或数据库中,至于其它的出版品或数据库,也都采用CAS RNs来标明化学物质,如Merck Index、Aldrich Catalog、Chem Sources、Dictionary of Organic/Inorganic Compounds和期刊Angewandte Chemie等。同时目前进出口海关化学物品时,也会要求要具备化学物质登录号的资料,由此可明显看出其重要性了。
让我们先来了解什么叫做CAS RNs─化学物质登录号,它是以最多九个数字并分三群来作编排,外面以【】表示,其数字的型式为【aaaabb-bb-b】,数字b的部份是固定存在的,也就是说最前面部份最少必须有二码、最多可高达六码。这里的数字大小可以看出一个化学物质被收录的新旧,原则上,RNs的数字愈大,表示这化学物质为新的化合物。这里也有一个方法可以用来检查CAS RNs的正确性:

其中:
N:CAS RNs除了检查号码之外,其它数字由右至左输入。
R:为检查号码
例如:【7732-18-5】
下面为REGISTRY FILE所提供资料之格式:
四、 利用化学分子式来检索资料
可以利用分子式来检索化合物资料的数据库并不多,但REGISRTY FILE可以以很简单的步骤来完成资料的收集。其中所检索的分子式排列需符合Hill System Order的要求,这里先来介绍Hill System Order的规则:
I. 针对单一化合物:
1. 若化合物不含C元素:各元素依其英文字母顺序来排列检索,如:H2SO4 →以H2O4S排列来检索。
2. 若化合物含C元素:先排C元素、再排H元素、其它元素则再依其英文字母顺序来排列检索,如:C9H8CL4N8O。
II. 针对多重组成化合物:
1. 组成物中一组成含C元素、另一组成不含C元素:将含C元素的组成先排列,再排列不含C元素的组成。而每组各元素的排列则同前I-1和I-2之规则来排列,如:C4H8N2O4.H2O。
2. 组成物中各组成均含C元素:先依各组中C元素的数目来决定,先排C元素多的组成,次之再排C元素少的组成;若各组成C元素的数目皆相同时,则依各组成的H元素来决定排列优先级;若各组的C、H元素也都相同时,再依各组的其它元素中第一个元素的字母顺序来决定排列优先级。而每组各元素的排列原则可依前I-1和I-2规则来排列,如:C2H4CL2.C2H4F2.C2CLF5.CHCLF2。
3. 多重组成物为高分子时:若为homopolymers时,元素排列先依I-1和I-2的规则来排列,再在其括符外加上X符号即可,如(C8H8)X;若为copolymers时,各组成的排列先依II-2的规则来排列,再在其括符外加上X符号即可,如(C4H6O2.C2H3CL.C2H3F)X。
4. 若为盐类时:为酸性盐类则其分子式中以H取代金属,再以分号把金属元素标示出,如:sodium acetate以C2H4O2.NA表示之;为胺盐类则其分子式中把胺盐中的H元素转移到阴离子上,使化合物以中性表示出,如:trimethylammonium chloride以C3H9N.CLH表示之。
在众多的化合物中,由于同分异构物的关系,会造成不同的化合物也会有相同分子式,所以以分子式来检索资料会得到非唯一的结果,这时必须配合化合物的命名来一同检索,以缩小检索结果。下面的例子是利用分子式来检索资料,得到三种不同的同分异构化合物,这时只有配合命名来缩小检索结果,这时的命名必须取所要的化合物中与众不同的独特片段名称才可以检索出唯一的化合物。若是利用一个分子式检索出的化合物结果太多时,就不适合再利用分子式检索资料,这时以化合物的结构式来做检索方法才合适。下面例子为利用分子式来查询有关2,5-DINITRO-3,4-DIBROMOTHIOPHENE化合物的资料:
五、 利用化学结构式来检索资料
STN线上检索系统的软件─STN Express有强大的化学结构绘图功能,它可以在离线的状况下,先画化学结构式进而再上线来检索资料,其中的结构式可以有多样的变化来选择,下面将有讨论。它可以快速同时很准确的找出所要查询的化合物资料,这最适合用在查询新化合物的合成资料,若再配合Markush结构式的检索,则对新化合物合成的专利资料会有非常完整的收集,这是STN线上检索系统非常强大的功能,但所需的检索费用也比较昂贵,这也是检索资料所要考虑的因素。下图为STN Express软件的界面:
STN Express画化学结构式的软件有四种不同型式的检索选择,同时其费用如下表所示:
检索指令型态 检索出的结果范围 检索费用(美元)
EXACT 与所绘的结构完全符合,同时还包括其同位素、立体异构物、单体聚合物、自由基和带电化合物。 39.00
FAMILY 含EXACT以外,另包含了其盐类、混合物和其共聚物的化合物 44.50
SSS 除了含EXACT和FAMILY以外,还包含了所有其它不同官能基之取代及延伸相关的结构式。 113.50
由上表可得知,以化合物的结构式来检索资料的费用是比较昂贵,但它也有它独特的地方,除了特定的(EXACT)结构式的检索外,它还可以配合下面其它比较特殊的功能做进一步的检索:
1. 可变异的官能基(Variables):选用此 功能键,可以以唯一的符号检索包含同类或同族的取代基;其中X表示所有卤素原子、A表示除了氢以外的所有原子、Q表示除了氢和碳以外的所有原子、M表示所有金属原子等、Cb表示碳环状化合物、Hy表示异碳环状化合物、Ak表示直键碳化合物等。
2. 不定官能基(G-group):可以在同一位置上定义多种不同的取代基的检索,所以只要画一次结构即可检索同一主体上有不同的取代基。
3. 不定位的取代(Variable Point of Attachment):对于环状化合物而言,若化合物可能同时有邻-、间-或对-位的取代时,则STN Express软件可在同一结构上找出不同位置的取代的化合物。
4. 重复取代基的定义(Defining a Repeating Group):STN Express软件可定义有相同结构的某一原子或一群原子同时排列在一齐时,可利用其定义功能来检索,其中重复的取代基的数目可从0─20单位皆可。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

Liuxiaoer

铜虫 (小有名气)


★★★ 三星级,支持鼓励

顶一下,向LZ学习,好多东西我都不知道呢
7楼2008-05-24 16:07:06
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 8 个回答

yalefield

金虫 (文坛精英)


★ 一星级,一般

CAS,STN等编码,是信息时代之前的产物,应该说早已过时了。
随着计算机、数据库和因特网的发展,出现了越来越多的新兴编码。

Daylight公司的SMILES线性码,可读性强
InChI化学品标识码,把分子结构和标识组合起来,特别适合登记、管理

化学是一个“古老”的学科,有很多残余势力
在很多方面,都出现了新、旧斗争。

例如,化学键等长度,习惯用埃表示,这样,键长就是1左右,符合人类习惯。
可是新标准就非得用纳米,于是键长就变成0.1左右,很别扭。

还有,能量,本来习惯用卡,可是标准要用J

至于化合物命名以及CAS编码,是在是个捉襟见肘的烂摊子,整天拆拆补补。

总之,该改革的,如CAS Rn,很顽固,没改;
不该改革的,该得到很快。
4楼2008-03-29 02:24:57
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
简单回复
gyy6665楼
2008-05-20 03:29   回复  
☆ 无星级 ★ 一星级 ★★★ 三星级 ★★★★★ 五星级
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见