有人知道听说过和数软件的和数链课堂吗?怎么结合区块链和教育做培训课程的?

来源:贵阳日报 时间: 14:52:01 作者:

刚刚过去的2018年,贵阳大数据教育实训基地建起了NIIT大数据培训学院,与CIO时代学院城市分院签订战略合作协议并共同举办CIO时代中国行活动;全球高标准课程录播中心启用,针对贵阳实体经济企业量身定制的“大数据+智能制造”课程频频获点赞;成功引进10家培训机构,并引进了红帽、华为、360等知名企业优质培训课程,打造一流的大数据培训平台……

一年来,贵阳大数据教育实训基地全力培育大数据创新氛围,夯实大数据人才基础,推动大数据人才培训,以产业化培训道路,打造贵州省大数据培训高地,致力为贵阳市建设“中国数谷”提供人才保障与智力支撑。统计显示,该基地全年完成培训2423人次,超额完成全年目标任务。

位于高新区的贵阳国际人才城。

重点项目提升大数据培训质量

自贵阳大数据教育实训基地开展大数据人才培训工作以来,贵阳、贵州乃至省外不少单位、企业慕名而来,一批批学员在这里拿到了NIIT、百度、微软、华为等培训认证,一批批学员通过培训顺利进入到大数据企业就职……随着培训需求的增长,以及培训系统的成熟,今年,贵阳大数据培训走上了一条产业化道路,完成了四个重点项目,推动大数据培训质量提升。

去年以来,贵阳大数据教育实训基地完成了NIIT大数据培训学院项目,购置西部研发基地1——3层用于建设NIIT培训学院,现学院已完成装修改造并投入使用;依托NIIT教学资源,以理论+项目实践的教学模式,开展非学历教育培训。学院建成后,依托NIIT教育资源,联合ITIL、华为、微软、百度等知名机构,结合需求,开展专业技术培训和行政事业单位培训。

基地还与CIO时代学院城市分院签订战略合作协议并共同举办CIO时代中国行活动;与中国电子技术标准化研究院信息中心签订合作协议,合作举办贵阳国家高新区2018年大数据标准化专题培训班,推进大数据标准化人才培养。

此外,基地还设置了多元化课程体系,满足不同培训需求。贵阳大数据教育实训基地去年根据对企业、单位人才需求的调查,建设了一套大数据多元化课程体系,以互联网、大数据、人工智能和实体经济深度融合为主导,通过和微软、百度、华为等机构深入合作,联合开发大数据培训课程,建立系统化、多元化的培训体系,培养大数据复合型人才。

创新思维开展“复合型”培训

2018年,基地拓展创新思维,开展了形式多样的“复合型”培训——开展行政事业单位培训16期,培训近千人,包括湖北省商务局各部门负责人及业务骨干进行的大数据培训,省直机关及各地州市信息中心负责人在深圳市、杭州市接受的大数据培训;对全省司法戒毒系统信息中心负责人及业务骨干组织的大数据培训等等。职业资格培训举办了5期,培训千余人,不仅有高新区内企业员工参加初级会计师培训,还有云上贵州集团员工参加商务礼仪培训。此外,还配合NIIT对高新区内企业在职员工开展培训。党风廉政培训两期,对贵州煤田地质局35名党支部成员、洛湾小学24名党支部成员开展党风廉政培训。

大数据培训不仅有“高精尖”也有“平民化”。2018年,贵阳不少中小学生走进贵阳高新区的创客公园、高新企业,触摸和认识大数据,这是该基地让大数据培训走进校园、走进生活的一个缩影。去年以来,该基地与贵阳晚报小记者团签订战略合作协议,组织前往高新启林创客公园、联合制造广场等地开展中小学研学旅行活动。

不断扩展市场增加培训资源

去年以来,基地不断扩展培训市场——与贵州省大数据发展管理局、清华大学自动化系对接,并前往清华大学实地考察洽谈,双方决定合作建设贵州——清华大数据研究生实践教育基地,目前正拟定教学管理方案,计划于2019年迎来首批清华大学自动化系的研究生学员;并与红帽、华为、360等知名企业对接,将利用自身平台优势,引进众多企业优质的课程资源,打造一流的大数据培训平台。

同时,基地还赴遵义市、铜仁市、黔东南州进行业务拓展,从培训课程、师资队伍等方面进行宣传,目前已成功与黔东南州工信委、大数据办联合举办大数据培训班。

此外,基地还充分开展市场调研并成功引进10家培训机构——与贵阳仪之邦礼仪形象管理咨询有限公司签订战略合作协议,合作开展商务礼仪培训;与贵州风之原教育科技有限公司达成合作意向并签订战略合作协议,联合举办研学旅行活动;与重庆高博职业技术学校签订战略合作协议,合作开展PMP项目管理培训;与北京和利时数字技术有限公司签订战略合作协议,赴北京总部考察调研;与北京希艾欧管理技术有限公司签订合作协议,共同举办CIO时代中国行活动;与北京普开数据技术有限公司签订合作协议;与贵州大学继续教育学院签订战略合作协议并合作开展大数据考察培训;与北京北航先进工业技术研究院有限公司签订战略合作协议;与贵州省大数据产业发展应用研究院签订战略合作协议;与贵州中科卓越科技有限公司签订战略合作协议。

贵阳大数据教育实训基地2019年培训计划“出炉”

记者日前从贵阳大数据教育实训基地获悉,基地已建成课程池,收录了8大类共计52门课程。2019年,基地主要开展三大类培训,计划培训2500人。

据了解,去年以来,贵阳大数据教育实训基地不断丰富课程体系,创新培训模式。采取理论学习、现场教学、小组讨论、学员分享、合作互助等新颖的教学模式,并与授课讲师对接,实时更新课程池。

大数据应用能力提升研修培训。

今年,基地计划重点开展三大类培训:第一类是党风廉政培训——计划举办3期培训班,培训150人次。基地将与省、市委党校对接,联合打造精品党风廉政培训课程,创新党风廉政培训模式,弘扬廉洁文化,发挥培训辐射效应;与省内各红色教育基地对接,建立党风廉政实训点,推出精品党风廉政参观线路;积极与合作开展培训的单位及地州市行政事业单位对接,进行党风廉政培训业务拓展。

第二类是行政事业单位培训——计划举办22期培训班,培训人次1180人,主要是承办各省直部门、市直单位、地州市部门的省内外培训班。依托“贵州省大数据人才培训基地”及“贵州——清华大数据研究生实践教育基地”建设,与各培训单位保持紧密联系,挖掘培训潜在资源,积极与各地州市行政事业单位对接,了解培训需求,制作培训计划。

第三类是职业资格培训——计划举办8期培训班,培训人次1170人,主要是举办会计培训班、红帽大学生培训班、红帽企业在职员工培训班,同时配合NIIT开展企业在职员工大数据培训。基地将依托国家技术标准创新基地(贵州大数据)示范平台单位,与中国电子技术标准化研究院信息中心合作,面向全省开展大数据标准化企业开展专题培训;依托红帽、华为等优质的培训资源,针对大学生、社会人士、在职员工开展职业技能培训;根据企业需求,开展计算机、会计、基金、证券等各种职业资格认证培训;与贵州省大数据发展管理局对接,开展大数据人才评价及专业技术职务评审专业培训。

此外,基地针对之前在培训过程中总结出来的“痛点”,今年还将重点优化培训管理,细化培训流程。结合《培训综合质量评估表》的突出问题点,对症下药,对预见性问题提前做好防范措施,采用项目负责制的管理模式,将培训具体事项责任到人,进一步改善培训管理制度。

同时,拓展宣传渠道,提高基地知名度。基地目前已设计官方logo并初步建成官方网站,今年计划创建百度百科词条、建设微信公众号,通过网站推广、微信分享等方式进行多途径推广,叫响培训基地这块招牌。

获贵阳“大数据教育实训公共服务示范平台”

成为“贵州省大数据人才培训基地”

去年4月,贵阳大数据教育实训基地获贵阳市“大数据教育实训公共服务示范平台”称号。

位于贵阳高新区贵阳国际人才城的贵阳大数据教育实训基地,面积近4000平方米,包括培训服务区、实训区、孵化区、展示区,拥有8间教室,配备300台教学计算机,可同时容纳500人上课。

该基地针对制造企业“痛点”,量身定制了“大数据+智能制造”课程,邀请海信、海尔等企业高管、技术骨干在课程中分享当今最前沿的智能制造知识,开课后收到200余家制造业企业踊跃报名;而针对刚毕业的大学生,基地培训大数据收集、数据管理、数据维护等知识,首批31名学员如今全部在贵阳高新区内10家大数据企业就职;面对公务员,该基地开设大数据应用能力提升示范培训等系统课程……计划到2020年,培育各类大数据人才1.5万人以上。

由于基地充分利用培训课程、师资、合作机构方面的资源,结合产业发展需求,针对不同层次、主题、对象制定培训菜单,完善规模化、专业化的大数据人才培训体系,培养一批大数据技术技能人才,壮大贵州大数据人才队伍,获贵阳市“大数据教育实训公共服务示范平台”称号。

去年10月,贵州省大数据局为贵阳大数据教育实训基地授牌“贵州省大数据人才培训基地”。

贵阳大数据教育实训基地遵循“政府引导、政策支撑、市场驱动、企业主体”的可持续发展市场化运营机制,整合和调动各方培训资源参与大数据标准人才培养服务,建立公共服务平台建设;依托国际创新的大数据教育和培训优势,以印度国家信息学院(NIIT)和中国电子技术标准化研究院合作为抓手,制定以“政府大数据”“大数据开放共享”“物流大数据”“人工智能”“区块链”等领域为重点的课程体系及项目实训,高标准、高质量做好培训工作,获得“贵州省大数据人才培训基地”授牌。

成为贵州省大数据人才培训基地后,基地发挥“清华研究生院贵州实践基地”的载体作用,采取“政——校——企”联手的方式,利用清华大学师资和生源优势,为贵州培训、吸引大数据人才,并将此合作模式拓展至其他国内知名高校。将人才投入到大数据项目当中,以项目带动人才、通过项目培训人才,把贵州省大数据人才培训基地打造成大数据人才培养的摇篮。

15个项目获软件著作权

去年底,由贵阳大数据教育实训基地自主研发的学生学籍信息查询系统、网络教学管理系统、课后在线答疑平台、培训资料采集管理系统等15个项目获得由国家版权局颁发的“计算机软件著作权登记证书”。从单一的大数据培训,到多元化培训体系,再到如今的创新专业技术,提升核心竞争力,贵阳大数据教育实训基地打造出了一块“培训品牌”。

“获得软件著作权登记证书的软件将得到国家法律和‘中国版权保护中心’的重点保护,软件著作权是企业的无形资产之一,是对企业核心自主知识产权的肯定,提升了我们基地专业技术的核心竞争力和行业知名度。”贵阳大数据教育实训基地相关负责人说,该基地将继续开展技术创新工作,专注IT职业教育、云计算、大数据、VR/AR/MR、人工智能、电子商务等领域研究,加强培训课程研发和自主创新,为企业提供更优质的高端技术服务和整体解决方案。

获“两创城市示范”专项资金

去年底,贵阳大数据教育实训基地凭借领先的教学资源、优质的服务质量、创新的人才模式,获得贵阳市“两创城市示范”专项资金支持。

该基地相关负责人介绍,在专项资金支持下,基地将进一步创新人才培养机制,通过建立健全专家智库、打通人才输出渠道、搭建人才交流平台等措施,不断提高人才培训服务能力和培训品质,为贵阳乃至全省大数据产业发展作出更大贡献。

}

作为支撑比特币实现无中心高可信的账本管理的技术,区块链在金融领域得到了广泛关注.区块链实现了不完全可信环境中的可信数据管理,具有去中心化、防篡改、不可抵赖、强一致和完整性等特性,但同时也存在高延迟和低吞吐率的性能问题.在互联网技术发展、新型应用层出不穷的大背景下,借鉴区块链在数字加密货币应用中的成功经验,探索可信数据管理的理论、技术,并设计、实现系统,是学术界所面临的重要问题.从可信数据管理角度,介绍了区块链相关的技术和研究进展,包括分布式共识、智能合约、数据溯源等,并分析了应用对可信数据管理所提出的需求和研究挑战.

区块链(blockchain或block chain)是指通过数据加密、数据链式钩稽、多副本存储和分布式共识等机制, 实现去中心化的分布式数据管理技术.它最早是由中本聪提出, 并在比特币(bitcoin)中加以实现和应用[].随着比特币应用的快速发展, 区块链技术所具有的防篡改、不可抵赖、强一致和完整性等特性, 特别是它的对等网络(peer-to-peer network)去中心化本质, 得到了工业界和学术界的广泛关注.在加密货币[]、分布式账本[]、单据管理[]、首次代币发售(ICO)和众筹[]、慈善[]等领域, 区块链技术得到了广泛的探索和应用.

另一方面, 最早的区块链技术被设计用于比特币这一特殊的虚拟货币应用.它与应用紧密结合, 所能提供的数据管理功能简单, 同时基于工作量证明(proof-of-work, 简称PoW)的共识机制的计算量耗费巨大, 导致极低的系统吞吐率和很长的系统延迟.如何提供丰富的数据管理和数据处理功能, 提高系统性能, 成为区块链研究、开发和应用所关心的热点.以以太坊(Ethereum)[]和Hyperledger[]等为代表的开源项目则提供了相对完善的区块链的开发与应用基础, 推动了区块链普及、应用的快速增长, 以及新问题的发现与研究.

从数据管理角度看, 区块链的本质是一个构建在对等网络上、提供了可信数据管理功能的数据库系统.一个可信数据库管理系统从3个层面确保系统的可信性, 即存储的可信性、处理的可信性以及外部访问的可信性, 如所示.


存储可信性是指数据处理结果一旦被确认, 不会丢失或被篡改.它要求系统提供传统数据库管理系统[]和事务处理[]中所要求的事务持久性(durability), 但同时也要求系统在存储、通信故障, 甚至在蓄意攻击时, 仍能确保数据存储的正确性.

处理可信性一方面是指数据处理的正确性, 另一方面是指处理过程和结果可审计与可溯源.前者要求事务的并发控制, 而后者则要求系统不仅保存数据的最终状态, 还要保存数据处理的过程.数据处理的正确性是对传统数据管理系统的基本要求.但是, 传统的数据库管理系统是集中式的, 保持事务的ACID属性已有成熟并相对高效的技术[, ].对等网络环境中的数据管理, 大都专注于查询处理的性能[, ].虽然已有大量关于分布式系统中的共识(consensus)机制研究[, ], 但在数据管理系统中, 由于性能问题, 共识机制和跨节点的协调通常只被用于选举主控节点, 而较少被直接应用于事务处理或被尽量避免[].因此, 在区块链这样的去中心化对等网络环境中, 如何在确保系统“正确”的同时, 实现高效事务处理, 就成为一个突出的问题.

处理过程和结果的可审计及可追溯也是重要的研究问题.在传统的数据库管理系统中, 数据库中存储、维护的是当前的数据状态, 处理过程和数据的历史信息通常存储在数据库日志中, 仅被用于故障恢复[, ], 并不直接提供查询服务; 在系统无故障正常运行的情况下, 也不参与查询的处理.在节点不可信的对等网络环境中, 一些查询和事务在处理时需要验证数据的历史状态, 以确保当前状态的正确性.因此, 传统的数据管理技术无法被直接应用于这一场景.

数据溯源(data provenance)是数据管理中的一项重要技术, 在科学数据管理和数据仓库中有着广泛的应用[].然而, 很多数据溯源技术仅针对集中式数据库或节点可信的分布式环境, 在区块链的应用场景下无法直接应用.

外部访问可信性是指对用户访问的认证.在实现机制上, 它依赖于分布式身份认证等技术, 也与具体的应用场景和业务紧密相关.本文的综述不涉及外部访问可信性.

与已有的从数字货币[]、安全[]、协议[]、系统架构[]、私有链[]和研究挑战[]角度所进行的区块链技术综述不同, 本文从可信数据管理的角度梳理区块链与相关数据管理技术的关联, 介绍在不完全可信的对等网络环境中的数据管理问题和相关技术, 并分析它们在新型应用场景中的适用性.由于外部可信性一方面与应用的具体模式紧密关联, 另一方面又可以部分地依赖于分布式认证[]技术解决, 因此, 本文聚焦于存储可信性和处理可信性技术.

本文第1节简单介绍区块链的基本数据结构和概念.第2节从分布式共识的角度介绍存储可信性保障技术.第3节介绍处理可信性, 包括智能合约及其问题、数据溯源技术以及可认证查询处理.第4节简要介绍主要的区块链系统和应用.最后, 第5节对可信数据管理技术所面临的研究挑战进行分析.

区块链的基本数据结构包括两部分, 即区块内结构与区块间链式结构, 分别如和所示.一个区块包含头信息和体信息.头信息是区块的元数据, 用于验证区块, 并与其前驱和后继区块建立关联.通常, 头信息包含自身时间戳、前驱区块的签名值、一个特殊值(称为nonce)、验证要求(如难度目标).体信息则是交易的序列.


只有当一个区块的签名结果满足验证要求时, 一个区块才能通过验证.例如, 在比特币中, 区块散列(签名)后的结果值必须小于某个特定值(该值由难度目标决定, 随着时间的变化, 难度逐渐增加)[].当一个区块需要与其前驱建立关联时, 其体信息、前驱区块签名值、自身时间戳、验证要求等信息都已经确定, 唯一能调整以获得不同自身签名值的变量就是nonce值.只有当获得了合法的nonce值后, 区块才能通过验证, 与前驱区块进行链接.

区块内的交易序列常通过特殊的数据结构, 如Merkle-tree[], 进行组织.Merkle-tree是一种树型数据结构, 最初提出时为二叉树, 但可被拓展为多叉树, 其叶子节点为数据项或数据项的散列值, 每一个内部节点的值为其所有子节点的散列值, 从而根节点的值可被视为整棵树的签名.利用这一性质, Merkle-tree可被方便地用来实现数据集相等测试、定位修改以及零知识证明.因此, Merkle-tree在区块链中被用于检测区块副本是否相同.

区块链的逻辑结构确保区块间的关系可验证.在系统中, 一个区块存储于多个节点, 以应对由于节点或网络故障所引起的区块副本丢失问题.

需要注意的是, 对于区块(k-1), 可能存在多个区块k1, k2, …, kp, 都能通过验证, 成为(k-1)的后继.如何让参与区块链的所有节点对区块链结构达成一致, 其本质是分布式共识(consensus)[]问题.通常, 区块链仅承认链最长的那条链.下一节将对区块链中的分布式共识机制进行介绍.

区块链系统的另一个重要方面是其提供服务的接口.在比特币应用中, 区块链仅提供转账, 即事务的执行与查询.而随着应用需求以及以太坊和HyperLedger等系统的发展, 新的区块链平台提供了称为“智能合约(smart contract)”的用户代码执行机制.从可信性角度看, 智能合约不仅可被执行, 且其执行历史将被记录, 执行过程和结果可审计、可追溯.第3.1节将介绍区块链中的智能合约处理机制, 而对于数据溯源这一特殊问题则在第3.2节中加以介绍.

2 存储可信性 2.1 工作量证明机制

如前所述, 存储可信性解决区块的容错一致问题, 其本质是分布式共识问题.比特币中的区块链采用了被称为工作量证明(proof of work, 简称PoW)的机制来解决这一问题.PoW基于如下技术和假设:根据bk, thk-1计算使hk满足验证要求的nonce需要耗费算力, 每次计算nonce所需的算力在一定时间段内相当.这一计算过程被称为“挖矿”.因此, 如果需要篡改或伪造记录, 则需要构造一条比当前被公认的区块链(主链)更长的链, 因此需要的算力需要超过整个区块链中的其他(正在进行正常挖矿运算的)算力.或者, 更准确地说, 在考虑网络延迟时, 攻击者的算力接近50%就会破坏比特币区块链的正确性[].而当考虑“自私挖矿(selfish mining)”——也就是当自身“挖矿”所获得的链比别人的链长时, 不发布自己的链, 在自己的链上继续挖; 当自身的链和别人已发布的链相比等长或者更短时, 立即发布自己的链, 并在别人已发布的链上继续“挖矿”, 那么, 攻击者接近1/4算力即会危及比特币的正确性[].

PoW共识机制的另一个问题是其性能问题.如Vukolic[]和Tseng[]对PoW和传统的拜占庭容错问题进行了详细的对比分析所述, 由于比特币区块链为“公有链”, 即其参与读取、交易以及共识机制的用户是开放的, 其用户规模是动态的, 参与者是匿名的.这直接导致了PoW机制的低吐率和高延迟.但从另一个角度看, PoW机制实现了系统的高可扩展性, 支持从数千到数十万个参与者, 这一网络规模远远大于绝大多数金融机构信息系统的规模.

2.2 实用拜占庭容错机制

区块仅有被选举出的唯一主控节点生成.PBFT由请求、预准备、准备、提交这4个阶段构成.预准备由主控节点发起, 准备阶段各节点分别验证主控节点发起的共识请求的正确性, 并将验证结果返回给主控节点, 并由主控节点汇总后在提交阶段确定是否提交.与PoW相比, PBFT适用于节点数少于20个的场景, 可拜占庭容错少于1/3的节点的攻击, 即有少于1/3的节点存在漏发、错发或选择性错发消息情况, 主要开销在于网络消息传输带宽, 吞吐率可达数千, 并将延迟降到毫秒级.此外, PBFT可确保系统的最终一致性.由于具有这些特性, PBFT被应用于HyperLedger Fabric.

PoW和PBFT考虑的都是拜占庭容错问题.在私有链的场景下, 若假设节点或参与者不进行攻击, 则可进一步放宽假设.Paxos是重要的非拜占庭场景下的共识机制[, ], 可被用于私有链场景.与PBFT相比, Paxos的吞吐率可进一步提升到超过4万tps[].

2.4 其他面向区块链的共识机制

PoW、PBFT和Paxos分别是3个典型的可用于区块链的共识机制.除此以外, 不同的区块链项目也采用它们的改进版本或其他机制.PPCoin采用权益证明(proof of stake, 简称PoS), 面向公有链, 避免了PoW导致的算力消耗和能源消耗[].PoS通过奖励机制鼓励参与节点成为验证者节点, 区块的产生由随机选取的验证者节点或验证者节点集合验证获批.PoS避免了PoW导致的大量算力和电力消耗.Ripple为另一个公有链平台, 采用其自身的RPCA机制实现共识[].RPCA首先将共识问题归结到系统中的一组“受信任”节点, 然后采用类似于PBFT的投票选取主控节点方式, 实现共识.

比特币区块链仅支持“挖矿”和转账, 功能上仅适用于数字货币, 具有很大的局限性.在传统的数据库管理系统中, 用户通过提交事务来处理数据.事务常由过程型语言与SQL语句组合共同构成, 事务执行的过程或结果通过日志进行记录.以太坊首先采用智能合约实现区块链中的数据处理[], 而区块链的逻辑结构本身就和日志具有相似之处.

智能合约是指通过信息技术手段实现的可自动执行的任务合约[], 其概念出现远早于区块链技术.智能合约包含执行条件和执行逻辑.当条件满足时, 执行逻辑会被自动执行.从数据管理角度看, 智能合约与数据管理系统中的触发器和存储过程[]具有相似性.另一方面, 与传统数据库管理系统中的事务不同, 不仅智能合约所做的处理结果需要在区块链中保存, 智能合约本身也需要被保存在区块链中, 并在系统的各个节点间同步, 以确保不同节点和用户所看到的智能合约的一致性.

比特币区块链仅提供非常简单的脚本语言, 用以实现智能合约; Ripple不提供智能合约; 以太坊提供图灵完备的智能合约脚本语言; 而HyperLedger Fabric则提供Go和Java撰写智能合约的功能.

智能合约扩展了区块链处理数据的能力, 但同时也对其使用者以及系统的安全性提出了更高的要求.以太坊智能合约曾发生TheDAO攻击[].Maurice Herlihy对区块链中由并发控制等因素导致的智能合约问题进行了系统的梳理[].

类似于数据库日志, 区块链维护了区块链上所有操作和处理的记录.但区块链所提供的数据查询及分析处理功能较为简单.作为一种可信数据管理系统, 对区块链上的数据进行溯源, 是一个重要的问题.虽然理论上, 在像比特币这样的区块链平台上, 每一笔交易都能够回溯到“挖矿”所获得的原始比特币, 但是如何在引入更为复杂的智能合约以后, 在区块链平台所管理的数据随着应用增多、规模扩大以后越来越多时, 高效处理数据溯源查询, 是区块链技术发展及在更多应用中推广使用所面临的研究题目.

数据溯源(data provenance)是指对于数据处理流程的管理, 解决回答数据为什么是该状态(why)、数据从哪儿来(where)以及如何获得(how)的问题[, -].数据溯源的研究在科学数据管理、数据仓库、数据资产管理(data curation)的背景下进行.

不需要对源数据和目标数据(处理的结果)附加额外的信息.但是, 此时需要了解存储、维护数据进行了何种处理.当处理是可逆的时候, 通过目标数据, 就能反推得到源数据.需要注意的是, 虽然如SPJ(select-project-join)这样的查询, 数据处理是可逆的, 但是很多数据库常用查询是不可逆的.例如, 很多聚集函数是不可逆的.非标注的数据溯源可用于数据变换、数据集成过程的调试[].当源数据与目标数据之间的数据模式改变时, 这类方法尤为有用.

基于批注的方法将每个数据项变换为〈s, d, i〉三元组标签, 其中, s表示数据项源, d表示目标数据(当前数据), 而i则表示中间数据结果.通过在数据处理过程中进行标签传播, 实现数据的勾连,

数据溯源的查询表达具有严格的代数学基础[, ], 可在关系数据库上实现[].CuratedDB[]和Trio[, ]是两个重要的数据溯源原型系统.

数据溯源的理论和技术与数据的结构化模式之间关联紧密.虽然在当前的区块链应用中, 数据未必一定是结构化的, 但是, 随着应用的发展, 区块链数据管理中数据模式的管理将成为一个重要的问题, 也将是现有数据溯源方法能否被成功应用的关键问题.

3.3 可认证数据查询与处理

在查询区块链中的数据时, 确保每个区块中数据的正确性是确保最终结果可信的前提, 该问题类似于外包数据库中的可认证查询处理[, ].与可认证查询处理类似, 区块链也常用基于Merkle-tree的结构来维护一个区块内的事务之间的关系.

随着区块链上查询需求的增长, 在链式日志结构上的索引技术也正在成为重要的研究问题[].

除了查询处理, 近年来在如云计算平台这样的硬件和操作系统不可信的非可信计算平台上, 提供可信的数据处理, 也成为了研究热点.例如, Haven系统原型通过在飞地(enclave)中利用Intel SGX芯片和Linux LibOS实现屏蔽模块(shield module), 提供包括线程、虚存、调度与文件系统的抽象, 提供了无需进行修改的应用程序与Windows操作系统间的相互调用[].

VC3是由微软研究院研发的另一个原型系统, 用以在Hadoop平台上运行MapReduce程序, 确保数据与处理是可信的[].与Haven不同, VC3并不在SGX中加载操作系统库, 而只在其中加载Map/Reduce程序与处理的数据.程序与数据仅在处理器上运行时是解密的.

Haven和VC3都可以运行未经修改的代码, 并处理数据.针对机器学习问题, 如决策树、SVM、神经元网络、矩阵分解、K-means聚类等算法, Ohrimenko等人提出了运行于SGX的保护隐私的机器学习方法, 他们通过使用实现了oblivious原语的libO库, 重写机器学习算法, 达到了可验证的安全机器学习的目的[].

类似地, Sinha等人提出, 通过将代码分为包含程序逻辑的用户程序和包含内存管理和加密通信原语的运行时库两部分, 当运行时库满足信息发布约束(information release confinement, 简称IRC)时, 系统的数据处理的安全性是可验证的[].

4 区块链数据管理系统与应用

除比特币、以太坊和HyperLedger以外, 近年来还出现了一大批区块链相关的系统.

BigChainDB试图同时实现传统数据库管理系统的高性能和区块链系统的可伸缩性[].它采用两层架构.底层依赖于MongoDB, 实现事务和故障恢复, 高层利用基于权威的区块链协议应对攻击情况下的容错.由于没有采用拜占庭容错机制,

Bitcoin-NG的设计目标为“下一代”比特币, 以具备更好的可伸缩性[].与其他同类系统相似, 它也采用两层协议, 一层选主.选举得到的主控节点负责事务的串行化执行.由于避免了事务执行中的PoW, Bitcoin-NG可实现其更好的可伸缩性的目标.

Blockstack为普林斯顿大学研发的基于区块链的命名和存储服务[].Blockstack将用于控制的元数据管理与数据存储分开管理, 并用skip-list管理区块, 以避免大规模地扫描区块链.实验结果表明, 它能极大地减少计算资源的消耗.

在应用方面, CrowdBC为基于以太坊的去中心化的众包平台[].众包中的任务分发、回收等操作都采用智能合约实现.通过采用区块链技术, 与集中式众包平台相比, CrowdBC可以更好地保护用户的隐私.ProvChain则通过采用区块链技术, 在云计算服务中提供数据溯源和数据验证服务[].

与以上系统和应用不同, Weaver是一个图数据库, 提供了对于区块链结构的高效查询[].

Quorum()是Morgan基于以太坊开发的面向企业的区块链平台, 与以太坊相比, Quorum实现了拜占庭容错的共识算法, 其事务吞吐率可达到近千事务/秒.而Corda()则是R3公司主导研发的开源分布式账本平台.Corda面向金融应用, 与其他区块链平台不同, 它并不在所有节点上维护所有数据的副本, 并且, 在分布式共识机制的基础上提供了便利的业务逻辑编写机制.

通过分析可见, PoW共识机制、智能合约等区块链技术是面向金融应用, 特别是数字加密货币而设计的.它们在确保对等网络中数据和处理的可信性方面, 具有很好的特性, 可伸缩性尤其突出.但同时, 现有的区块链技术在如下3个方面仍然存在着缺陷.首先, 现有区块链系统和平台的服务接口通常是过程性的, 需要用户撰写复杂的智能合约, 与数据库系统声明性的数据操纵相比, 容易导致错误和漏洞产生.第二, 现有区块链系统大都不支持复杂模式数据管理, 不能提供通用的数据建模和模式管理功能, 导致系统及平台与应用耦合度高、应用开发难度大.第三, 由于部分区块链平台, 特别是公有链系统, 为了保障系统可伸缩性, 采用了PoW共识机制, 在性能上, 特别是延迟和吞吐率方面, 无法与传统的可信数据管理系统相比, 无法满足大多数关键任务应用的需要.

当考虑更复杂场景下的可信数据管理问题时, 现有的区块链技术和系统无法被直接应用.另一方面, 信息技术发展是国家政策和新兴商业模式落实应用的前提:可信数据管理对于构建社会信用体系, 从机制上提供信用保障, 至关重要.

例如, 在共享经济、大宗商品交易、数字资产增值利用开发、安全监督、政府治理等应用中, 业务可能涉及双方或多方, 业务间关联模式各不相同, 数据的结构化程度不同, 事务的复杂程度和并发数不同, 数据处理的及时性响应要求也不相同, 借鉴区块链在数字加密货币应用中的成功经验, 特别是其在系统可伸缩性、完全去中心化、灵活的智能合约撰写、验证以及可信执行上的特点, 在对现有区块链和相关技术进行梳理和分析的基础上, 探索大规模分布式环境下的可信数据管理基础理论, 设计针对特定应用的可信数据管理系统, 或称其为“分享型数据库(sharing database)”系统, 提出安全、高效的可信数据管理系统实现方法, 是研究的重要问题.

当前所直接面临的研究问题包括:在特定场景下的高性能分布式共识机制、区块链上的结构化数据管理方法、区块链上的分布式数据索引构造和维护方法、链式结构或日志结构上的高效查询处理和优化技术等.

}

  12月13日,中国区块链领军企业蚂蚁金服、科蓝软件(代码:300663)联合主办的“链上金融践行之旅---区块链金融峰会”在北京阿里中心“光明顶”隆重召开。峰会现场座无虚席,近百家银行、消金领域的高管、专家共聚一堂,热烈讨论区块链技术在金融领域的应用实践和区块链金融的发展。

  本次峰会由科蓝软件王安京董事长做开幕致辞,他对区块链概念做了详细的阐述,同时对区块链在金融业的应用做了深入介绍。

  王安京董事长说:“过去几年,我们一直在讨论为什么要建区块链;10月24日后,区块链上升为国家战略,我们信心满满的重点讨论如何落地区块链;相信,明年之后热议的焦点一定是,你为什么不建区块链?区块链已经发展到应用层面,概念炒作将一去不复返。”

  蚂蚁金服资深总监李杰力围绕"价值互联网与区块链"发表致辞。李杰力表示,在接下来的十年、二十年,甚至更长的时间里,把广泛的数据金融化,在以区块链为底层的一张价值互联网上进行各种各样的流转、变现,是蚂蚁区块链在信息互联网发展至价值互联网上比较看好的一个方向。

  峰会上,蚂蚁金服和科蓝软件的区块链业务、技术专家围绕区块链金融的诸多议题做了精彩阐述。“区块链与新风控”、“区块链与小微信贷”、“开放联盟链的金融生态共建”、“区块链金融大规模商用之路”等内容干货满满,热点纷呈。结合与会嘉宾普遍关心的区块链在银行领域的实践落地问题,科蓝软件的区块链专家做了题为“区块链在银行的应用案例分享和未来展望”的专项演讲,集中总结展示了科蓝软件应用区块链技术服务于银行客户的实践经验和成功案例。

  科蓝软件是国内最早将区块链技术应用于银行业务场景的中国金融科技企业。2017年,科蓝软件携手贵阳市农村商业银行,共同建设推出了区块链数字权益平台;2018年,科蓝开发了城市商业银行汇票区块链应用,在银行汇票合作的金融机构之间建立了数据共享区块链平台;2019年,针对在移动银行、网络银行等互联网金融交易领域存在大量的法律纠纷,科蓝软件联合国家信息中心电子数据司法鉴定中心共同推出了“电子认证+保全鉴证”可信数据解决方案。

  蚂蚁金服与科蓝软件联合主办区块链金融峰会,是双方在区块链领域强强联合,携手共进的一个缩影。峰会的顺利召开揭开了双方共同推动区块链金融和未来数字金融发展的新篇章。凭借多年的沉淀和积累,蚂蚁金服和科蓝软件区块链专家团队将紧紧把握金融行业的真实需求,帮助银行等金融机构在区块链应用领域稳步前行,共同推动金融和区块链的全面融合。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

}

我要回帖

更多关于 根据本课程区块链应用包括哪些 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信