以前的博文中我介绍过一种表示化学分子结构的工具SMILES,在化学结构的表达方面,还有一种越来越流行的工具叫InChi,今天在这里也作一简介的介绍。
搞化学的人都知道,为了表达一个化学物质,通常使用的方法有:
1)化学名称,无论是中文名还是英文名,这是使用极其广泛的手段,但是这种手段有个非常大的弱点,虽然比较直观,但是唯一性非常不好。同样一个东西,可能有很多个名字。比如 水可以用Water,也可以用Hydrogen oxide. EMC可以叫碳酸甲基乙基酯,也可以叫碳酸乙基甲基酯,还可以叫碳酸甲乙酯,甲基乙基碳酸酯。 名称还有俗名,商品名,简单命名,甚至还有IUPAC标准命名等等,即使同是简单的命名,有的化合物有多个官能团,从不同分类出发可以得到不同的命名。因此,同一种物质有多个个合法的名称是非常常见的。因此需要严谨表达结构时,化学名称不是理想的选择。
CAS号是化学文摘社为化学物质编制的特定顺序编号,理论上每个化学物质有其唯一的特定编号,除非未被CAS收录或编制。由于化学文摘的功能强大,影响力大,加上CAS号短小精悍,易于书写(只有不到十几位数字两根短划线)CAS也就成为了表示化学物质的事实标准。很多化学数据库都收录了化学物质的CAS号。为了传递某种化学物质的信息,也常常借助于CAS号。CAS号虽然使用广泛,但它有两个不足: 1.CAS号与它代表的物质在结构上没有关系。根据CAS要得到其结构,还必须到数据库中进行查询。2. 化学文摘社并没有向社会免费开放它的CAS号检索功能,对一些较新的物质,其CAS号并不能自由地使用,它是有版权的。
3)化学结构式。这个倒是比较准确,但是依赖于绘制结构式的软件。如果结构式从专用的化学软件导出成为图片,它就失去了结构式贮存的化学意义,无法做化学上的进一步利用。这种信息需要以文件的形式来传递,如果用文本来表示就比较困难了。
4)SMILES。用比较简短的文本来表示分子的结构,算是比较理想的表达方式,得到了比较广泛的应用。但是SMILES的算法不是自由免费的,日光化学公司对其拥有版权。所以目前还出现了一个叫OpenSmiles的规范。
5)特定格式的化学结构式文件,如CDXML格式,CDX格式,cml格式,MOL格式,SKC格式等等,这些格式种类较多,本质上不过是第3)项的存储而已,优点/缺点基本相同。其中MOL格式比较常用,很多网上的化学软件都支持。
为了在文本中快速存储与表达结构式,比如在数据库文本字段中存储,在简单文本中传递化学物质结构,其实上面的手段只有1)2)4)可用。但这些都存在一定的不足。为了避开SMILES或CAS在版权上的不够自由,保证国际社会可以免费自由使用,同时又能做到准确唯一,IUPAC和InChi-Trust开发了这个工具。
Identifier三个单词的头部字母的组合,“国际化学标识符“的意思。实际生成的Inchi样子是这样的。比如以碳酸乙烯酯为例:
这个字串实际上分为几层,层与层之间用斜杠分开。1S表示是Inchi版本号为第1版;C3H4O3是分子式;c4-3-5-1-2-6-3是原子连接信息;h1-2H2是氢原子的连接情况。
在ChemOffice等软件中,复制这样的字串,再在编辑器内,弹出菜单中选择 Paste Special,再在下级菜单中选择InChi即可以将InChi文本转化为结构粘贴到编辑器内。反过来,选择一个结构,再选择工具栏上的“Edit“菜单,下面点击 “Copy As", 选择InChi即可以将该结构的InChi文本复制到剪贴板上以供粘贴使用。如果在记事本等编辑器内粘贴,即可得到文本字串。
从InChi字串可以看出,从文本上不容易看出对应的分子结构是什么,但它确实可以通过一定的算法转化出分子的结构。从InChi字串来比较两个分子是否相似,是否一个是另一个的子结构,这样的功能InChi是 不支持的。
至于从结构如何生成对应的InChi字串,这是一个并不直观的算法问题,有兴趣的可以看看相关的介绍材料,我也没有研究过。 开发Inchi的组织不仅提供了技术手册,还提供了计算Inchi的库的源代码和程序等,我一并转载放在下面。其中有一个InChi-FAQ.pdf比较通俗易懂,回答了很多关于Inchi的奇怪问题,英文好的同学可以看看。
目前InChi的版本是1.0, 支持不超过1023个原子的化学结构式。对我们做电解液这类小分子研究的应该是十分够用了。
因为InChi文本比较长,人们在此基础上经过一些算法运算,基于InChi生成了一个27个字符的新字串作为Inchi的签名,叫做InChi-Key。InChi与生成它的Inchi有一一对应关系,InChi由于使用的字符会被搜索引擎忽略,因此搜索InChi不成,但只要找到InChi-Key,我们就可以找到它的InChi-Key,如果两者都提供了的话。
从InChi计算出InChi-Key是单向的运算,因此InChi-Key不能用于表达分子结构,它相当于是找到Inchi的一个索引而已。
转载本文请联系原作者获取授权,同时请注明本文来自丁祥欢科学网博客。
天津大学20XX年招收攻读硕士研究生入学试题生物化学
一、名词解释:(共计25分,每题5分)
二、填空:(共计20分,每题1分)
1. 透明质酸是由()与()组成的糖胺聚糖。
2. 糖类除了作为能源之外,它还与生物大分子间的()有关,也是合成(),(),()等的碳骨架的供体。
3. 一种蛋白质按其重量含有1.65%亮氨酸和2.48%异亮氨酸,该蛋白质的最低分子量为()提示:亮氨酸和异亮氨酸的分子量均为131Da。
4. 在蛋白质颜色反应中,Tyr与米伦试剂反应呈(),与酚试剂反应呈()。
5. 研究RNA和()转移和鉴定的技术是()和Western印迹法。
6. 在体内缺乏维生素()时会使血凝时间延长,该维生素的溶解性为()。
7. 肾上腺素主要生理功能为(),其机制是通过()完成对"靶细胞"的作用。
8. 酶的专一性分为()和()。
9. 构成细胞膜脂质双层结构的物质是()和(),()对细胞膜的流动性起主导作用。
10. 钠钾ATP酶每水解一分子ATP,泵出()个钠离子,泵入()个钾离子。
11. 肠道中转运葡萄糖的载体分别有()和()。
12. 糖原合成的关键酶是(),糖原分解的关键酶是()。
13. 细菌光合作用中CO2的还原剂是()和()。
15. 脂蛋白按照密度的不同可分为(),(),()和()。
16. 尿素循环又称(),是将有毒的氨转变为无毒的尿素的循环。()是尿素循环的重要器官。
17. 核苷三磷酸在代谢中起着重要的作用。()是能量和磷酸基团转移的重要物质,()参与单糖的转变和多糖的合成,()参与卵磷脂的合成,()供
教学目的与要求:掌握生物化学的含义,主要研究内容、学科分支、学科特 点、生物化学的地位,以及学习生物化学的意义。 生物化学的概念(0.2学时) 生物化学的研究内容(0.25学时) 生物化学发展简史(0.15学时) 生物化学的发展趋势(0.15学时) 生物化学的学习方法(0.25学时) 教学重点与难点:生物化学研究内容;生物化学的发展趋势 生物化学(Biochemistry)这门学科,顾名思义是研究生命的化学。它的准确定义是:在分子水平上研究生物体的化学本质及其在生命活动过程中的化学变化规律。即,运用化学的原理和方法来探究生命现象的分子基础。 二、生物化学的研究内容 1、生物体的化学组成、结构、性质和功能 2、生物体内的物质代谢、能量转换以及调节 3、生物体生命现象的信息传递与表达 生物化学研究的第三个方面,通过DNA的复制由亲代传递给子代。在子代的生长发育过程中,遗传信息从DNA转录给RNA,然后翻译成特异的蛋白质,以执行各种生命功能。 以上就是我们这个学期的生物化学课程将要学习的内容的一个概括,希望能够给大家一个粗略的轮廓,对大家以后的学习有所帮助。下面我简要介绍一下生物化学的发展简史。 三、生物化学的发展简史 1、生物化学的产生阶段(17~18世纪) 2、生物化的独立阶段(19世纪) 3、生物化学的发展阶段(20世纪上半叶) 4、生物化学的深化阶段(20世纪50年代至今) 四、生物化学的发展趋势 我们刚才讲过,蛋白质是生命的物质基础。对于生命活动领域,我们仍然了解的太少,大量的未知事件等待被研究。由于基因工程技术的逐渐成熟,后基因组时代,利用基因工程技术对蛋白质进行研究将会是生物化学领域的生长点。举例来说,在老年痴呆这一疾病的研究中,我们已经知道有一种叫做APP的蛋白起到非常重要的作用,它分解后形成的小分子肽Aβ是老年痴呆的重要致病因子之一。 今后生物化学发展的另外一个重要的特点就是学科间的交叉。由于研究内容越来越深入,单纯的生物化学知识和技术已经不能满足需求,细胞生物学、神经生物学、发育生物学和生物制药已经与现在生物化学的研究密不可分。如果我们要研究一种酶在细胞内的生理功能,我们就必然结合细胞生物学的技术;如果我们要研究神经活性物质的作用机理,我们也无法避免要结合已有的神经生物学研究成果;生物制药,由于它在造福人类方面不容忽视的影响以及它对于社会经济发展的促进,也会是今后生物化学研究的一个热点。 思考与练习:1、什么是生物化学?它的研究内容主要有哪些? 2、生物化学在生命科学中占有什么地位? 3、生物化学在实践中有何意义? 掌握氨基酸的结构及理化性质;蛋白质分子的基本结构、空间结构及理化性质;蛋白质变性、复性的过程。 了解蛋白质的各种分类方法。 一、蛋白质的分子组成(0.5学时) 1、蛋白质的元素组成特点 2、氨基酸的结构通式,氨基酸的理化性质氨基酸的连接方式 二、蛋白质的分子结构(2。3学时) 1、蛋白质的一级结构:蛋白质一级结构的概念及其主要的化学键。 2、蛋白质的空间结构: 蛋白质的二级结构的概念、主要化学键和形式:α-螺旋,β-折叠,β-转角与无规卷曲。掌握α-螺旋,β-折叠的结构特点 蛋白质的三级结构概念和维持其稳定的化学键:疏水作用、离子键、氢键和范德华引力 蛋白质的四级结构的概念和维持稳定的化学键 3、蛋白质结构与功能的关系:一级结构决定空间结构,空间结构决定生物学功能。 三、蛋白质的理化性质(2学时) 3、蛋白质的变性、沉淀和凝固 4、紫外吸收和呈色反应。 四、蛋白质的分类(0.2学时) 重点:氨基酸的重要理化性质,蛋白质的性质;蛋白质的结构层次 难点:蛋白质的二级结构。 蛋白质是生物体的基本组成成份。蛋白质是由20种氨基酸组成的高分子有机物质,典型的蛋白质分子含数百至数千个aa残基,分子量数千至数百万。 蛋白质在自然界及生物体中分布广、含量高、功能多种多样。它是生命体系中最重要的成分。肌肉、毛发、血细胞等以及常见的鸡蛋、皮革、蚕丝等都主要是由蛋白质组成的。蛋白质在人体内的含量很多,约占人体固体成分的45%。 它的分布很广,几乎所有的器官组织都含蛋白质,所以它又与所有的生命活动密切联系。它不仅是生物体的最基本的组成物质,又是生命活动的主要体现者。 二、蛋白质的生物学意义(功能多样性) 1、迄今为止,几乎所有的酶都是蛋白质。 酶:酶的化学本质主要是蛋白质,且催化的反应温和、快速、专一,任何生命活动之必须,有的还具有辅酶 2、组成成分,如参与细胞结构的建造,起支持和保护作用。 结构成分:胶原蛋白(肌腱、筋),角蛋白(头发、指甲),膜蛋白等。生物体就是蛋白质堆积而成,人的长相也是由蛋白质决定的。 4、调节物质代谢的激素有许多也是蛋白质或它的衍生物; 5、疾病的发生与防御也与蛋白质有关。 防御异体侵入机体,清除抗原,具高度专一性。病毒外壳蛋白 免疫系统:防御系统,抗原(进入"体内"的生物大分子和有机体),发炎。 细胞免疫:T细胞本身,分化,脓细胞。 体液免疫:B细胞,释放抗体,导弹,免疫球蛋白(Ig)。 蛋白质--它是构成生物体的一类最重要的有机氮化合物; 蛋白质不论其来源如何(动植物、微生物),各种蛋白质的元素组成很近似各元素的百分比对于大多数蛋白质都较相似;所含的主要元素有: 除此之外,不同种类的蛋白质中尚含有少量的其他元素,这些称为微量元素。蛋白质中所含的微量元素主要有: 碘,主要存在于甲状腺球蛋白中。此外还有锌,铜等。 蛋白质元素组成的特点是一切蛋白质都含有氮元素(或者说是区别于糖和脂的特征性元素),且比较恒定,平均为16%。而糖、脂多不含氮,即使含氮,其量也甚微,且不恒定。 是由多种氨基酸结合而成的一类具有特定的空间构象和生物学活性生物大分子。 形状:纤维状蛋白质对称性差,分子类似纤维或棒状,通常在生物体内作为结构成分存在,比如胶原纤维、角蛋白、丝心蛋白等;球状蛋白质分子对称性好,接近球型或椭球型,在细胞内通常承担动态的功能,大多数蛋白属于这一类。 第一节 蛋白质的基本组成单位――氨基酸 一、氨基酸的一般结构特征 目前,已发现的氨基酸可能超过200种左右,但组成蛋白质分子的氨基酸只有20种左右。这20种氨基酸也称为蛋白质氨基酸。这20种aa中,除脯氨酸外,都具有下图所示结构: 二、氨基酸的分类(自学) 三、氨基酸的重要理化性质 氨基酸的化学性质是由它的结构决定的,不同氨基酸之间的差异仅在侧链上,因此氨基酸具有许多共同的性质,个别氨基酸由于侧链的特殊结构尚有许多特殊的性质。 这是氨基酸最重要的性质。氨基酸分子中既含有羧基,又含有氨基,故它是两性电解质。两性离子,又称为兼性离子即在同一个分子中含有等量的正负两种电荷或在同一氨基酸分子上带有能放出质子的-NH3+正离子和能接受质子的-COOH-负离子。 氨基酸既是两性电解质,它在溶液中的带电情况,随溶液的pH的变化而变化。改变溶液的pH,可以使氨基酸带正电,或带负电。 在一定的pH条件下,氨基酸分子中所带的正电荷和负电荷数相同,即净电荷为零,此时溶液的pH称为该种氨基酸的等电点(pI)。氨基酸的等电点是它呈现电中性时所处环境的pH。不同氨基酸由于分子中所含的可解离基团不同,解离程度不同,等电点不同。在等电点时,氨基酸的物理性质有所不同,最显著的特性是溶解度降低。氨基酸的等电点可由实验测定,也可根据氨基酸分子中所带的可解离基团的pK值来计算(课本方程式)。 从上述结论知,等电溶液的pH与离子浓度无关,其值决定于两性离子两侧的可解离基团的pK值。 例如:甘氨酸在PH值为1的酸性条件下带正电荷,而当溶液的PH值为11的碱性环境时,则带负电荷;当溶液的PH值调到5.97时,甘氨酸主要以两性离子存在。此时甘氨酸分子中正负电荷相等,净电荷为0,不显电性,因此,5.97就是甘氨酸的等电点,即PI=5.97。 当氨基酸处于等电状态时,由于静电的作用,此时氨基酸的溶解度最小,容易沉淀(正负电荷相等,分子之间通过静电引力而结合成集聚体而易于沉淀)。由此,我们可以用调节溶液pH值的方法(即等电点法),使某一氨基酸大量沉淀而达到分离制备的目的。例如在味精生产中常采用等电点法使谷氨酸从发酵液中沉淀出来,只要调节发酵液的pH值至谷氨酸的等电点pI=3.22时,谷氨酸就可大量沉淀出来。 一、有关肽的一些基本概念 在蛋白质分子中,氨基酸之间是以肽键相连的。肽键就是一个氨基酸的α- 羧基与另一个氨基酸的α-氨基脱去一分子水缩合形成的键,又称为酰胺键。 氨基酸之间通过肽键联结起来的化合物称为肽(peptide),其实就是一种酰胺化合物。两个氨基酸形成的肽叫二肽,三个氨基酸形成的肽叫三肽……,以此类推。十个氨基酸形成的肽叫十肽,一般将十肽以下称为寡肽(oligopeptide),以上者称多肽(polypeptide)或称多肽链。50个氨基酸以上,有特定的构象,就被称为蛋白质。组成多肽链的氨基酸在相互结合时,失去了一分子水,与原来的相比,分子稍有残缺,因此把多肽中的氨基酸单位称为氨基酸残基(amino acid residue)。 肽链结构中有主链和侧链之分,主链骨架是指除侧链R以外的部分。
在多肽链中,肽链的一端保留着一个自由的α-氨基,另一端保留一个自由
第三节 蛋白质的分子结构
一、 蛋白质的一级结构
定义:蛋白质的三级结构是建立在二级结构的基础上的。二级结构的基础上(包括超二级结构和结构域)再进一步盘曲或折迭形成含主链和侧链在内的具有一定规律的紧密的近似球形的专一性的三维空间结构,称为蛋白质的三级结构。
1、a.卵清蛋白、b.β-乳球蛋白和c.糜蛋白酶原的pI分别为4.6、5.2和9.1。指出在下述pH下,它们在电场中向阳极、阴极移动还是不动?①a在pH5.0②b在pH5.0和7.0③c在pH5.0、9.1和11?
对于真核生物,DNA主要存在于核的染色质中(细胞分裂时期除外),极少量的存在于核外,如线粒体、叶绿体。核内的DNA通常与组蛋白结合,以染色质的形式存在。
核酸中的戊糖有核糖(ribose)和脱氧核糖(deoxyribose)两种,分别存在于核糖核苷酸和脱氧核糖核苷酸中。 |