

科学家集体“围观” AI新技能解锁
国内首个人工智能闭环的生物结构数据库在临上线
蛋白质是生命活动的重要基础,研究其结构与功能对药物研发具有极其重要的意义。此前,全球科学家耗费几十年时间解析了约21万种蛋白质结构。而人工智能程序AlphaFold在发布后,仅一年时间就预测出2亿多个蛋白质结构,这一成果在科研界引发了广泛关注。6月5日在我区召开的第一届全国人工智能生物学大会上,上百名专家学者围绕“人工智能赋能生命科学发展”进行研讨。
此次大会推出一项重磅成果,去年7月落户青山湖科技城的膜生物学全国重点实验室,宣布其研发的生物结构数据库正式上线。这是国内首个人工智能闭环的生物结构数据库,其作用之一就是在生物大分子的人工智能(AI)解析等领域,建立具有自主产权的“生产端数据收集、应用端数据赋能”的生物结构数据库。
膜生物学全国重点实验室副主任、清华大学生命科学学院副教授张强锋这样解读:“AI在预测单个蛋白质结构上取得了重大突破,但在蛋白质动态的结构、突变的结构,以及蛋白质与其他分子形成的复合物结构方面还有很多问题没解决。我们通过冷冻电镜技术信息,再加上与AI的深度融合,可以完善这方面内容,为药物靶点结构解析及新药研发提供数据支撑。”
随后进行的路演展示了数据库中的生物大分子结构原子模型,其形状如同由原子通过化学键编织成的一个个动态“分子雕塑”。比如藻胆体复合物在光合作用中负责捕获光能,包含超过700条链和超过13万个氨基酸,在静态画面中犹如一堆线球,经过人工智能与冷冻电镜实验深度融合,可以解析出高度准确的三维结构。
这也是膜生物学全国重点实验室生物结构数据库的特点之一,即从单分子解析走向全景式动态观测,为人类解码生命三维密码的征程奠定坚实基础,从实验室构建迈向真实生命场景重建。
对于人工智能可以在数据库中发挥什么样的作用,中国人工智能学会理事长戴琼海这样解释:“现在的人工智能模型需要大数据,数据的规模要足够大,然后对这些数据进行完整的整合和分析。而蛋白质的结构数据量大,如果靠人类来做要几百年。通过人工智能来做,相当于几十万甚至上百万人同时在分析一个问题,不但缩短了时间进程,而且将结构预测功能的准确性发挥到极致,这就是人工智能大模型的魅力。”
随着AI模型不断在解构人体蛋白质“功能图谱”表现出强劲潜力,膜生物学全国重点实验室生物结构数据库的上线,为“数据自主可控”和生物制药的自主研发及国产替代注入全新动能。
落地临安以来,已构建起“清华系”教授为核心的一个科学家协同创新转化工作室集群,新建“AI+生物医药研发公共技术服务平台”、“3D细胞药械公共技术服务平台”两个平台,并推动落地孵化转化公司7家,累计入驻全职博士8人,投入研发费用1200余万元,产学研合作项目5个,在生物大分子的AI解析、新药研发、细胞制剂开发等方面为区域生物医药产业提供创新赋能和配套技术服务。
说到为何落地临安及目前近况,张强锋介绍:“当地政府非常的务实、接地气,虽然全国各地都有吸引人才的政策,但临安把这方面工作落到实处。比如有一对一的项目专员服务我们,具体的事务和困难,都会第一时间给予帮助。”他拿下自己戴着的运动眼镜,笑着说,喜欢跑步的他,在这里能遇见很多环境优越的运动场所。
对接膜生物学全国重点实验室的服务专员,是青山湖科技城党工委委员、发展服务中心主任李萍,谈到科技城在“人工智能+生物学”领域的发展规划,她说:“将深入推进创新链、产业链、人才链融合发展,让人工智能、生物医药产业更具竞争力,在新型膜生物学技术、药物靶点结构解析、特别是人工智能驱动的大分子结构解析等前沿领域,不断攀登科学高峰,产出更多原创性、引领性的重大成果。
记者 孙梦蕾
江苏路特数字科技有限公司 仅提供技术服务支持, 文字、图片、视频版权归属发布媒体