像人类蛋白质图谱(HPA)这样的组学规模项目的范围显然是巨大的。你能分享一些关于HPA的历史,特别是早期的情况吗?
HPA项目始于2003年,我们在2006年开始了细胞图谱的工作。基因组计划于2001年完成,由于知道人类大约有2万个基因,Mathias教授Uhlén决定启动一个项目,目的是描述这些基因编码的蛋白质。这是一项重要的知识,因为蛋白质更接近于功能的代理。通过确定蛋白质表达的环境,也就是器官、细胞和细胞器的环境,我们可以开始了解它们的功能。
最初的努力是针对产生一个蛋白质组范围的抗体收集和验证其特异性。为了完成如此庞大的任务,早期的努力旨在建立强大的自动化平台和协议进行大规模免疫检测。
HPA正在创造的大量知识和数据的潜在应用是什么?
人类蛋白质图谱数据库每月有来自世界各地研究人员的超过25万次访问。从基础细胞生物学和系统生物学到旨在了解和预防疾病以及开发更好药物的研究,这些数据被广泛使用。特别是对于HPA细胞图谱,蛋白质亚细胞分布的知识不能通过测序很好地推断。因此,该数据对以测序为基础的旨在了解细胞功能的研究具有很强的补充作用。
在这次比赛中建立的“图像分类器”将如何帮助培养对细胞生物学的新见解?
在我们的工作中,目前的一个瓶颈是我们的图像中蛋白质的亚细胞分布的可靠分类。有几个因素使这个任务变得复杂。我们知道大约一半的蛋白质定位于细胞的多个隔间我们也使用了一系列不同的细胞类型和不同的形态。还有一个明显的职业不平衡,在图像中混合了非常罕见和非常常见的模式。通过Kaggle挑战,我们希望获得一个鲁棒的分类器,可以分配所有不同细胞类型的蛋白质的亚细胞位置。该分类器不仅将我们从耗时的手动模式分类中解脱出来,而且还为改进元胞体系结构的分析提供了机会。
一旦一个成功的“图像分类器”和HPA一起公开,下一步会是什么?
下一个要解决的计算问题将不仅是识别模式,而且实际分割它们,以便更好地对数据进行后续分析。单一精细模式的分割是一项具有挑战性的任务,混合模式的分割更是如此。如果能够更有效地分割不同的细胞器,就可以实现蛋白质定位差异的定量测量和作为一个系统的细胞的定量理解。
你认为细胞生物学成像的未来是什么?
机器学习的最新发展和大规模高参数成像的新方法将极大地影响细胞生物学成像的未来。计算成像的发展将提高大视场的分辨率,以及“无标签”应用,其中细胞结构的预测将使活细胞的微创和高参数测量成为可能。另一个感兴趣的领域是高度多路复用技术,在同一样本中可以看到数百种蛋白质或rna。我相信,这些发展加上开放获取图像库的建立,以及用于空间模式和环境量化的改进计算模型,将使成像成为探索所有人类细胞特征的关键技术。
在与这样的公司合作研究项目时,你的期望是什么?188金宝搏怎么注册
学术界和工业界之间的合作项目是促进科学发展的迫切需要。我们的实验室开发了自动反馈显微镜的管道,在这种情况下,我们依赖于与显微镜供应商的良好沟通,理想情况下也要包括在公司的发展计划中,以最大限度地协调协同。188金宝搏怎么注册
了解更多:Kaggle和HPA
通过赞助这次比赛,徕卡微系统进一步能够为生物知识的扩展和改进做出贡献,同时188金宝搏的网址,帮助建立工具来精确分析创建的大量数据。
了解更多关于Kaggle和人类蛋白图谱(HPA).