基于文本挖掘技术的技术层面专利组合分析方法优化--以药物专利数据为例

来源 :第十三届全国医药信息学大会(CIMA2015)、第三届中国护理信息学大会(CNI2015)暨第十六届中日韩医药信息学联合 | 被引量 : 0次 | 上传用户:chyanzmr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析技术层面专利组合分析方法的基础上,对技术层面专利组合分析方法进行优化.以某生物制药企业专利数据为例,采用文本挖掘技术,通过技术领域标签抽取、专利文本特征表示、专利文本聚类等流程,对专利文本所属技术领域进行划分.采用层次聚类算法中自底向上的凝聚方法,开始将每项专利作为单独的一个组,逐次合并相近的专利对象或专利组,直到所有的专利组合并为一个组,最后利用层次聚类谱系图将聚类过程及聚类结果表示出来。从层次聚类谱系图中可以看到专利文本被聚类成若干专利组团,每个组团即可代表一种技术领域,利用层次聚类谱系图可以更加科学客观的将专利划分为若干技术领域。解决了原专利组合分析方法中由于利用IPC号和专家访谈法作为技术领域的划分方法容易出现偏差的缺点.
其他文献
  目的 研究军事医学本体构建过程中概念的获取方法,解决目前现有军事医学知识组织模式中概念陈旧不完善的问题。方法 在继承传统叙词表等知识组织法的基础上,提出基于文献关
1998年8月4日至6日,中共红河州委干部教育委员会、州委组织部、州委党校在弥勒县委党校组织召开了红河州党校系统首届“创优争先”表彰大会。有6个先进集体,15名先进工作者
  针对传统计算机实验室设备陈旧、实验环境可扩展性差、维护管理复杂、数据稳定性保障等问题,介绍了桌面虚拟化技术特点和体系结构。本文以我校计算机实验室机房建设为例,借
  精准医疗是以个体化医疗为基础,通过基因组、蛋白质组学等技术对人群与特定疾病类型进行生物标志物的分析与鉴定、验证与应用,期望精确到疾病的病因并确定治疗靶点。慢性心
热原是一类在宿主体内可以引起发热和诱导炎症反应的异构类化合物。在临床上,热原是指能使哺乳动物产生热原反应的物质。热原按照来源分为外源性热原和内源性热原。外源性热原主要来源于机体外,分别为微生物(如细菌、病毒、真菌)与非微生物(如抗原、抗肿瘤药)性热原,内源性热原主要包括机体内的激素(如类固醇、前列腺素)与细胞因子(如肿瘤坏死因子、干扰素、生长因子、白介素)。使用热原污染的药品和医疗器械会引起系统性
  目的 结合应用移动平均趋势剔除法于比例因子法,进行门诊诊次的预测。 方法 采用移动平均趋势剔除法,计算趋势值和季节系数,配合最小二乘法建立预测模型,并应用比例因子法消
本文通过移动平均值法的应用,对浦东新区共享平台的高血压就诊历史数据进行建模、预测和检验.移动平均值法测定时间序列中季节变动,既能反映长期趋势变动,又能消除周期变动和
木质纤维素原料复杂的结构抗性,极大地限制了纤维质乙醇的转化效率。虽然环境友好、低能耗的白腐菌生物预处理技术可降低原料酶解抗性屏障,增强乙醇转化效率,极具应用前景。
  文章以CT 检查报告为例,利用Spss Modeler 工具提供的Apriori 算法模型对报告术语进行关联分析。目的是发现“放射学表现”中病灶描述术语与“放射学诊断”的诊断术语之间
目的:建立预测浦东新区高血压就诊人数的预测模型.方法:采用季节预测方法中的移动平均比率法计算趋势值与季节指数,用移动平均比率法配合最小二乘法建立预测模型.结果:根据浦东