论文部分内容阅读
随着宽带和计算机技术的飞速发展,Internet网络已经走进千家万户;而基于Internet的应用呈几何级数增长,从最初的简单文本传输,到传输图文并茂的网页;再从传输网页到音频视频数据的传输,Internet成了信息时代不可或缺的信息载体。视音频数据的传输与应用逐渐成为网络信息的主流,Internet上涌现了一大批以视频应用为主的站点和产品,常见的有Google的Youtube,新浪网的新浪视频,CCTV的在线视频,PPLive的P2P影视等。流媒体数据传输有信息量大,占用带宽高,实时性要求高等特点,也就是说用户体验至关重要!如何检测一个特定流媒体网络的用户体验呢?Gomez Streaming产品就是通过采集流媒体网络数据,计算相关参数,进行用户体验分析的一种流媒体网络监测工具。它被部署到全球众多个网络节点,采集流媒体监测数据,汇总到中央数据库,通过中央门户网站为用户提供针对特定网络的用户体验数据分析和结果展示。Gomez Streaming产品可以为企业诊断多媒体内容的网站体验问题,它能够从世界各地自动复制用户的流媒体内容请求,并就可用性、启动时间和传输质量等问题进行告警。每个Gomez Streaming产品新版本的推出都需要经过大量样本空间的测试,检测数据可靠可信和产品质量的持续稳定变得至关重要,并且该产品已经发布给大量商业客户使用,产品质量涉及到公司的经济利益。这里有两个方面的问题亟需解决:1.随着客户的增多,Gomez Streaming产品将会采集越来越多的数据,在如此多的客户的压力下如何保证这些海量数据的数据质量,使用户体验数据变得更加可信?2.如何知道新版本产品比旧版本产品的数据更加可靠呢?关键的问题是,在海量的数据面前不允许一条条的来分析。有没有一套实际可行的方法?本课题就是力求解决上面的这两个问题,对Gomez Streaming产品采集来的海量数据从统计学的角度进行流媒体数据质量的分析与研究。提出了一种基于算术平均值,标准偏差等统计学理论的算法,并针对实际的流媒体数据指标DNS time, Connection time, FirstBytetime等进行了分析和实现。本论文主要进行了如下几个方面的工作:1.深入学习流媒体技术的概念和原理;对常用流媒体性能参数指标进行深入分析与研究。2.结合流媒体网络平台的实际应用,详细设计出基于算术平均值的数据质量分析算法公式和流程。3.实现一套数据质量分析系统并无缝连接到Gomez Streaming系统中。4.对该数据质量分析系统进行大量测试和结果分析。