团队简介
Introduction
团队成员
Member
研究成果
Outcome
演示下载
Demo
研究资源
Resource
学生招聘
Recruitment

团队介绍 (Introduction):

华南师范大学文本分析与挖掘实验室(TAM Lab)由计算机学院郝天永教授于2018年发起建立(前身为2014年成立的自然语言处理实验室),并同香港城市大学刘文印老师进行联合指导的科研团队。团队近年来获国家自然科学基金2项、国家人社部、教育部、广东省优青、香港GRF、广州市民生科技攻关计划等项目支撑,获科研经费超过300万元。

团队主要针对目前医学自然语言处理、文本挖掘、智能问答中存在的关键科学问题,从信息抽取、数据挖掘、大数据处理、人工智能角度出发,开展科学研究和系统应用开发工作。

研究内容 (Research Topics):


1)医学文本挖掘 (Medical Text Mining)
医学文本分析与挖掘逐渐成为一个热门而重要的研究领域。电子病历、电子健康档案、医学文献、临床指南、监管报告等医疗健康相关文本数据随着信息技术的发展而急速增加,利用自然语言处理、数据挖掘技术快速有效地抽取与挖掘这些海量文本数据将对社会公共健康、医疗决策等诸多方面产生积极而重要的影响。主要开展临床试验文本信息抽取、临床试验文本挖掘和分析、糖尿病知识抽取和知识图谱构建、医疗记录特征挖掘等研究。

2)智能问答(Question Answering)
智能问答是信息检索领域的一个重要分支,并逐渐成为新的研究热点。对一个以自然语言表达的问题,智能问答系统的任务是通过互联网或本地数据找出正确的答案,并以自然语言的表达方式返回用户。团队针对目前问答系统中资源重用率低、个性化服务能力不足等实际问题,以大规模问答数据资源重用为出发点,开展问题目标识别与分类、语义等价问题识别方法、多维语义模版模型、多模式QA融合框架等研究,同时,提高问答系统的精准性、增强问答系统的智能性和实用性以及领域实际应用的有效性。

3)医学智能问答(Medical Question Answering)
针对特定病种(糖尿病)开展面向医学特定领域的智能问答基础与应用研究。我国糖尿病患病人数世界第一,医疗费用庞大,糖尿病需通过多种治疗手段进行长期健康监控和病情控制,因此高危人群和患者长期需要各类与糖尿病相关的防治信息。研究将通过对大规模糖尿病临床试验文本的挖掘与分析获取糖尿病的重要特征属性,以此为基础构建面向疾病的用户潜在需求模型。本项目拟对美国国家卫生研究院全球临床试验文本进行大数据分析,挖掘糖尿病的重要特征,并以此作为用户糖尿病重要特征来辅助分析用户的潜在需求,研发糖尿病跨语言问答系统,进行个性化精准问答,同时对用户的重要特征健康状况进行跟踪、监控与预警。