近日,由成都文獻情報中心胡正銀副研究員、張志強研究員與西南交通大學曾榮強博士、中科院廣州生物醫(yī)藥與健康院覃筱楚、山西財經(jīng)大學隗玲博士合作撰寫的論文“A Method of Biomedical Knowledge Discovery by Literature Mining Based on SPO predications: A Case Study of induced Pluripotent Stem Cells”被施普林格出版社出版的論文集Lecture Notes in Artificial Intelligence(LNAI)Series:Machine Learning and Data Mining in Pattern Recognition收錄正式發(fā)表,并被《工程索引》(The Engineering Index)收錄。
隨著生物醫(yī)學科技信息數(shù)量的快速增長和生命科學研究的交叉發(fā)展,生物醫(yī)學文獻知識發(fā)現(xiàn)(Knowledge Discovery in Biomedical Literature,KDiBL)已成為生物醫(yī)學信息學的一個重要研究領域。論文圍繞“誘導多能干細胞”(induced Pluripotent Stem Cells,iPSC)這一干細胞研究前沿知識發(fā)現(xiàn)的具體需求,基于干細胞領域知識圖譜數(shù)據(jù),從細粒度、富語義的生物醫(yī)藥信息知識表示、面向主題的知識挖掘及全景式知識可視化展示三個方面出發(fā),以“主-謂-賓”(Subject-Predication-Object,SPO)三元組形式對iPSC領域科技文獻中蘊含的知識元進行了深度揭示與組織,挖掘出iPSC影響要素、疾病類型、人體病灶組織和實驗對象等多種類型的知識主題,并以語義網(wǎng)絡的形式全景式地展示了iPSC領域的知識脈絡,包括涉及的重要研究方法、實驗技術(shù)、細胞器官、基因及治療疾病等。
相關研究工作得到了國家社科基金重點項目“面向領域知識發(fā)現(xiàn)的學科信息學理論與應用研究”、中國科學院“十三五”信息化專項“面向干細胞領域知識發(fā)現(xiàn)的科研信息化應用”的支持,研究成果在 “the 14th International Conference on Machine Learning and Data Mining” (MLDM 2018)做了大會報告。
SPO語義網(wǎng)絡縮略圖