来自 科技 2021-10-11 14:09 的文章

不需数年,只要数小时,机器学习能快速揭示细胞内部结构

 不需数年,只要数小时,机器学习能快速揭示细胞内部结构


研究团队开发了一套算法,可在细胞的显微镜图像中绘制细胞器,创建细胞内部如何工作的详细3D图。
图片来源:COSEM项目团队

科技日报记者 张梦然

借由高功率显微镜和机器学习,美国科学家研发出一种新算法,可在整个细胞的超高分辨率图像中自动识别大约30种不同类型的细胞器和其他结构。相关论文发表在最新一期的《自然》杂志上。

领导该COSEM(电子显微镜下细胞分割)项目团队的奥布蕾·魏格尔说,这些图像中的细节几乎不可能在整个细胞中手动解析。仅一个细胞的数据就由数万张图像组成,通过这些图像追踪该细胞的所有细胞器,需要一个人花60多年时间。但是新算法可在数小时内绘制出整个细胞。

除了《自然》上两篇文章外,研究团队还发布了一个数据门户“开放细胞器”,任何人都可通过该门户访问他们创建的数据集和工具。这些资源对于研究细胞器如何保持细胞运行非常宝贵,过去科学家们并不清楚不同细胞器和结构怎样排列——它们如何相互接触及占据多少空间。现在,这些隐藏的关系首次变得可见。

在过去十年中,研究团队使用高功率电子显微镜从多种细胞中收集了大量数据,包括哺乳动物细胞。

最新的机器学习工具可在电子显微镜数据中精确定位突触,即神经元之间的连接。研究人员调整了算法来绘制或分割细胞中的细胞器,该分割算法为图像中的每个像素分配一个数字,这个数字反映了像素离最近的突触有多远,算法使用这些数字来识别和标记图像中的所有突触。COSEM算法的工作方式与之类似,但维度更多。研究人员根据每个像素与30种不同类型的细胞器和结构中的每一种的距离对每个像素进行分类。然后,算法整合所有这些数字来预测细胞器的位置。

研究人员表示,利用这些数字,该算法还能判断特定的数字组合是否合理。例如,一个像素不能既位于内质网内,同时又位于线粒体内。

为了回答诸如细胞中有多少线粒体或它们的表面积是多少等问题,研究团队构建的算法结合了有关细胞器特征的先验知识。经过两年的工作,COSEM研究团队最终找到了一套算法,可为迄今为止收集的数据生成良好的结果。

目前,研究团队正在将成像提升到更高的细节水平,并进一步优化工具和资源,创建一个更为广泛的细胞标注数据库和更多种细胞和组织的详细图像。这些成果将支持未来的新研究领域——4D细胞生理学,以了解细胞在构成有机体的不同组织中的相互作用。

总编辑圈点:

工欲善其事,必先利其器。在科研领域尤其如此:无论是望远镜之于天文学,还是对撞机之于物理学,亦或是显微镜之于生物学,科学研究的不断进步,总是伴随着工具和方法的迭代升级。甚至不少诺贝尔奖的诞生,也直接来自于科研工具或方法的重大突破或进展,或者与其息息相关。所以,科研工具或方法类的研究进展值得引起重视,它们很有可能为整个领域的研究提供强大助力。