【摘 要】
:
选取EMD(earth mover’s distance)作为度量概率数据相似性的标准.EMD具有抗噪性好,对概率分布间的微小偏移不敏感等优良特性,但却具有三次方的复杂度.针对此问题,提出EMD-kJoi
【基金项目】
:
国家自然科学基金资助项目(6100305860933001), 中央高校基本科研业务费青年教师科研启动基金资助项目(N100704001)
论文部分内容阅读
选取EMD(earth mover’s distance)作为度量概率数据相似性的标准.EMD具有抗噪性好,对概率分布间的微小偏移不敏感等优良特性,但却具有三次方的复杂度.针对此问题,提出EMD-kJoin算法,在相似性搜索方面,基于线性规划的对偶理论为概率数据构建索引,避免不必要的EMD求精计算;在处理流程方面,以复杂度较低的范围查询为主要操作,并逐步缩小搜索阈值.通过使用真实数据集对EMD-k Join进行测试,证明EMD-k Join极大提高了基于EMD的概率数据top-k相似性连接操作的执行效率.
其他文献
混沌相态分类是利用混沌系统检测微弱信号的关键步骤.提出一种基于改进型脉冲耦合神经网络的混沌相态分类方法.利用该网络模拟哺乳动物视觉皮层神经细胞活动的特点,提取混沌
传统的图像可听化方法多是在空间域选择映射特征,且声音编码维度比较单一,使得盲人学习和使用这种声音的难度较大.针对这一问题,提出了一种基于变换域的图像可听化方法,即对图像小波变换低频系数进行映射,使用频率和音长进行声音编码,将图像表示为电子音乐.实验表明,盲人对这种方法表示的图像具有较高的识别率,并且声音的听感优美,长时间收听不易疲劳.
针对移动对等网络中存在的节点移动、拓扑多变、资源受限和可扩展性差等问题,提出了一种基于轻量级层次结构的蚁群路由算法.该算法通过选取活动路由上的节点将网络划分成轻量
【正】简介:2010年6月,国务院办公厅正式印发了第一批"三网融合"试点地区(城市)名单,杭州市成为全国首批"三网融合"12个试点城市之一。目前,杭州市已在制定三网融合具体实施
针对系数矩阵A为H-矩阵,为线性方程组Ax=b引入了两种形式的预处理矩阵I+-S和I+S^,给出了相应的预处理Gauss-Seidel方法.证明了若系数矩阵A为H-矩阵,则新的系数矩阵(I+-S)A和(I+S^)A仍
提出了一种新型的双机驱动共振式振动机结构.振动体由支撑刚体与物料箱刚体组成,物料箱有4个自由度,支撑刚体仅存在共振方向一个自由度.物料箱通过软弹簧安装在与共振方向垂
【正】当钟情于一样东西时,它是一切,一切是它。四十六载的光辉岁月,万汇恪守精诚之道,捕捉乍现的建筑设计灵感,逐一打破行业瓶颈,远离浮华,拒绝轻佻。这一切,只为那从脚手架
"东南形胜,三吴都会,钱塘自古繁华。烟柳画桥,风帘翠幕,参差十万人家。……"北宋著名词人柳永在《望海潮》中浓墨重彩地铺叙展现了杭州的繁华景象,今天的杭州人依然用这首词
针对BGP缺乏有效的多路径实现的问题,设计并实现了一个基于CACTI的BGP多路径数据监测分析平台,通过给BGP协议配置多出口鉴别(MED)属性,利用BGP路由表及CACTI流量监测图,在实验
以21%Cr铁素体不锈钢为研究对象,研究了热轧退火及冷轧润滑对带钢中织构和晶粒簇的影响.结果表明:热轧退火再结晶不完全时,成品带钢中心处的晶粒簇明显,且带钢厚度方向上织构