论文部分内容阅读
随着大数据时代的来临,大量文本信息涌入了人们的生活中,如何更简洁高效地表达文本数据中所蕴含的信息成为了信息可视化领域的一个重要问题。词云是人们进行文本可视化的重要手段,近年来,具有形状边界约束的词云在社交媒体上受到人们越来越多的关注。然而,现有的生成形状词云的技术虽然达到了较高的词云填充率,却强行改变了单词之间原来成比例的大小关系,导致人们无法正确地获取词云中蕴含的词频大小信息。我们提出了一种新的技术,它可以高效地创建具有形状约束的词云,我们将其命名为ShapeWordle。运用这种技术,我们可以对单词进行调节从而使其能够组合成指定的任意形状,并在满足词云高填充率的同时保持词云中的数据真实性。为了指导单词在形状边界约束下的放置,我们运用形状的距离场信息,将传统的阿基米德螺旋线以微分的形式表达,使其可感知任意形状。进一步地,为了处理非凸形状,我们引入了一种多中心的词云布局算法。该方法将形状分为多个分区,对每个分区均应用可感知形状的阿基米德螺旋线自适应地生成单词放置策略,并混合多种单词表现方式对空隙处进行有效填充。为帮助用户生成更加具有语义的形状词云,我们还提供了丰富的编辑交互操作。此外,我们还针对时序文本数据,将可感知形状的阿基米德螺旋线应用于生成时序形状词云,扩展了我们方法的应用场景。为了验证我们方法的可靠性,我们将我们的结果与当前的最新技术进行了全面比较。同时,我们邀请了 14位用户使用我们的系统,并对他们的作品进行了案例研究。结果表明,我们的方法能够生成与给定形状更加相似的形状词云布局且具有更加明显的优势。