据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
袋装的粉色椰子水!「蔻蔻椰」推出鲜萃粉椰水
“会躺平”的粉色椰子水你们喝过吗?近日,「蔻蔻椰」推出新品:鲜萃...
“百亿”新乳业发布最新战略目标:力争年收入保持双
中国网财经6月1日新乳业发布进入百亿阵营后的最新战略目标。5月3...
盘龙药业:人才“孵化器”全面提升科研实力,助力研
近日,陕西盘龙药业集团股份有限公司发布公告称,公司通过了全国博士...
新加坡金管局与谷歌就生成式人工智能展开合作
2023年5月31日,新加坡金融管理局和谷歌云签署谅解备忘录,合...
双良节能驶入快车道,“绿电+绿氢”助力双碳目标
在刚刚过去的第十六届SNEC全球光伏大会上,有专业人士指出,“今...
精检细修确保暑运安全
为确保雷雨天气及繁忙暑运铁路行车安全,电气化局运管公司上海维管处...