基于Hadoop视频转码的任务调度算法_毕莎莎
基于优先级权重的Hadoop YARN调度算法

基于优先级权重的Hadoop YARN调度算法王荣丽;侯秀萍【期刊名称】《吉林大学学报(信息科学版)》【年(卷),期】2017(035)004【摘要】为解决Hadoop现有调度器调度任务时不能根据任务的紧迫程度分配资源的问题,研究YARN中的资源调度机制,改进原调度器(Capacity Scheduler),提出一种基于优先级权重的Hadoop YARN(Yet Another Resource Negotiator)调度算法(Weight Scheduler Based on Priority).为叶子队列设置队列优先级,结合队列资源利用率和队列优先级选择队列;将应用程序的初始权重设置为应用程序优先级的大小,通过等待时间判断是否更新权重,根据权重对队列中的应用程序进行排序,调度时优先为权重高的应用程序分配资源.实验结果表明,与原有调度算法相比,改进算法平均任务执行时间约减少141 s,平均等待时间减少34.5%,保证了用户执行任务的相对公平,提高了用户总体满意度.【总页数】6页(P443-448)【作者】王荣丽;侯秀萍【作者单位】长春工业大学计算机科学与工程学院,长春 130012;长春工业大学计算机科学与工程学院,长春 130012【正文语种】中文【中图分类】TP391【相关文献】1.基于Yarn的资源调度算法研究 [J], 彭宏恩2.一种基于YARN的高优先级作业调度实现方案 [J], 詹文涛;艾中良;刘忠麟;李常宝;高泽3.基于优先级与关键路径的工作流任务调度算法研究 [J], 张小庆;胡亚捷4.基于优先级与关键路径的工作流任务调度算法研究 [J], 张小庆;胡亚捷5.基于动态优先级设备低能耗调度算法 [J], 张忆文;林铭炜因版权原因,仅展示原文概要,查看原文内容请购买。
基于Hadoop与FFmpeg的多媒体分布式处理系统的设计

基于Hadoop与FFmpeg的多媒体分布式处理系统的设计郑娟;徐刘杰;吴豹;李彪
【期刊名称】《安阳师范学院学报》
【年(卷),期】2018(000)002
【摘要】视频媒体已经成为一种重要的网络资源,如何快速地为用户提供视频点播支持成为了一个严峻的问题.基于Hadoop分布式文件处理系统和FFmpeg音视频处理技术,构建一套分布式视频转码系统,将任意编码的视频文件转化H.264编码格式,能够实现在线实时点播;利用云端实现了用户转码请求监控、转码任务队列实时调度、运行资源分配等服务.实验证明:该系统的分布式处理有效的提高转码效率,也为资源提供了安全的分布式存储环境.
【总页数】4页(P49-52)
【作者】郑娟;徐刘杰;吴豹;李彪
【作者单位】滁州学院教务处,安徽滁州23000;湖南科技学院信息技术与教育系,湖南永州425100;滁州学院计算机与信息工程学院,安徽滁州239000;滁州学院计算机与信息工程学院,安徽滁州239000
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于Hadoop平台的交通数据处理系统设计与实现 [J], 王亚洲
2.基于Hadoop的实时数据处理系统设计与实现 [J], 李明东;王英;焦杰
3.基于Hadoop的葡萄种植大数据处理系统设计 [J], 滕毅有;李正;申智辉
4.Hadoop环境下分布式物联网设备状态分析处理系统 [J], 张瑞聪; 任鹏程; 房凯; 张卫山
5.基于Hadoop和MapReduce的大数据处理系统设计与实现 [J], 董楠楠;单晓欢;牟有静
因版权原因,仅展示原文概要,查看原文内容请购买。
《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》篇一一、引言随着信息技术的迅猛发展,互联网已经成为我们日常生活中不可或缺的部分。
随之而来的是海量数据的增长,如何有效处理并利用这些数据成为了一个重要的研究方向。
在此背景下,基于大数据分析的推荐系统应运而生。
特别是针对电影推荐系统,通过分析用户的观影行为、喜好等数据,能够为观众提供更加精准、个性化的电影推荐。
本文将介绍一种基于Hadoop的电影推荐系统的设计与实现。
二、背景与意义在互联网时代,电影作为一种重要的娱乐方式,其选择多样且数量庞大。
然而,对于用户来说,如何在海量的电影资源中寻找到符合自己喜好的电影成为了一个难题。
因此,设计并实现一个基于大数据分析的电影推荐系统具有重要的现实意义。
该系统能够通过对用户的历史观影记录、观影偏好等数据的分析,为用户推荐符合其喜好的电影,提高用户的观影体验。
三、系统设计3.1 系统架构本系统基于Hadoop平台进行设计,采用分布式架构,以适应海量数据的处理。
系统架构主要包括数据采集层、数据处理层、数据存储层、推荐算法层和应用层。
3.2 数据采集数据采集层主要负责从各种渠道收集用户的观影数据,包括历史观影记录、观影偏好等。
这些数据将被存储在Hadoop的分布式文件系统(HDFS)中。
3.3 数据处理数据处理层负责对采集的数据进行清洗、转换和加工,以便后续的推荐算法能够更好地利用这些数据。
3.4 数据存储数据存储层采用Hadoop的分布式数据库HBase,用于存储处理后的数据。
HBase具有高可靠性、高性能和可扩展性等特点,能够满足海量数据的存储需求。
3.5 推荐算法推荐算法层是本系统的核心部分,采用协同过滤、内容过滤、深度学习等算法,根据用户的观影历史和偏好,为用户推荐符合其喜好的电影。
3.6 应用层应用层是用户与系统交互的界面,用户可以通过该界面查看推荐的电影、搜索电影、收藏电影等。
四、系统实现4.1 技术选型本系统采用Java语言进行开发,利用Hadoop平台的相关技术,包括HDFS、HBase、MapReduce等。
基于 LLF 的 HADOOP 任务调度器

基于 LLF 的 HADOOP 任务调度器豆丁网标准与论文:基于 LLF 的 Hadoop 任务调度器荆超,吕玉琴,侯宾(北京邮电大学电子工程学院,北京 100876)5 摘要:Hadoop 是一个优秀的开源分布式计算平台。
通过 Hadoop 可以将各种不同配置的计算机组建成低成本、高性能的分布式集群,并且具有高容错性和可扩展性。
Hadoop 集群中可以同时运行成百上千的作业,这些作业共享系统资源,所以任务调度就成为一个问题。
本文提出了一种在 Hadoop 环境下的基于最低松弛度优先的任务调度算法。
目的是实现调度器的公平性并提供特殊抢占功能。
文章详细描述了该调度算法的内容,包括松弛度的表示方法、10 优先级的计算方法以及应对超时现象的方法。
另外还描述了调度器的设计结构和实现方式,并通过实验验证调度策略的有效性。
关键词:计算机应用技术;Hadoop;任务调度;最低松弛度优先LLF Scheduler in Hadoop15 Jing Chao, Lv Yuqin, Hou Bin(School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing100876)Abstract: Hadoop is an excellent open-source distributed computing platform. The Hadoop can take use of different configurations of computers to build low-cost, high-performance distributed20 clusters, with fault tolerance and scalability. Hadoop clustercan run hundreds of jobs that sharin system resources, so scheduling becomes a problem. This paper proposes a scheduling algorithm based on Least Laxity First(LLF) in Hadoop in order to achieve fairness and scheduling special preemption. This article discusses the details of the scheduling algorithm, including the representation of laxity, priority calculation method and the method of response timeouts. It also25 describes the design and implementation of the scheduler, and shows experiments to verify the effectiveness of scheduling strategies.Key words: computer application technology; Hadoop; task scheduling; Least Laxity First0 引言[1]30 Hadoop 是开源的分布式计算平台,实现了 MapReduce模型。
一种Hadoop中基于改进遗传算法的作业调度算法

一种Hadoop中基于改进遗传算法的作业调度算法徐肖;胡吉明【摘要】Hadoop platform is a distributed system framework,users who don’t need to know the underlying details of the case can devel-op distributed programming and take full advantage of the cluster to high-speed computing and storing. Job scheduling,as one of the core technologies in Hadoop,its main function is to control the order of job execution and the allocation of computing resources,which directly affect the overall performance and resource utilization of Hadoop. It is to study job scheduling problem based on genetic algorithm,propo-sing a new segmentation coding strategies,taking computing resources as the basic unit of the genetic operation. In addition a new regional hybrid operator and mutation operator are included. Experiments show that it is an effective job scheduling algorithm in Hadoop.% Hadoop平台是一个分布式系统基础框架,用户可以在不了解底层细节的情况下,开发分布式程序,并且可以充分利用集群来高速运算和存储。
基于PSODE的网格任务调度算法

基于 P S O D E 的网格任务调度算法
于泓博 ,李 会 ,韩德丽
( ) 齐齐哈尔大学 通信与电子工程学院 ,黑龙江 齐齐哈尔 1 6 1 0 0 6
摘 要 : 针对网格计算中任务在各个资源之间的调度问 题 , 提 出 了 一 种 网 格 环 境 下 P S O D E 的 任 务 调 度 算 法。该 算 法 实 现 了计算资源 、 存储资源 、 带宽资源 、 数据资源的利用率最高化和代价最 低 化 。 对 基 本 粒 子 群 算 法 和 差 分 进 化 算 法 进 行 了 分 析 , 通过构造算法函数 、 适应值函数和权重公 式 , 建 立 了 粒 子 群 差 分 混 合 算 法 并 对 其 进 行 优 化 , 介 绍 了 算 法 的 实 现 过 程 。 实验结果表明 , 该算法与其它调度算法比较 , 具有良好的性能 。 关键词 : 网格计算 ; 任务调度 ; 粒子群算法 ; 差分混合算法 ; 构造函数 )0 中图法分类号 : T P 3 0 1 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 2 4 1 4 4 7 0 5 - - -
:g ; ; K e w o r d s c o m u t i n t a s k s c h e d u l e s w a r m a l o r i t h m; d i f f e r e n c e h b r i d a l o r i t h m; c o n s t r u c t o r r i d a r t i c l e p g g y g p y
·1 4 4 8·
计算机工程与设计
2 0 1 2年
计算资源和 执 行 任 务 付 出 的 代 价 也 有 可 能 存 在 很 大 差 异 , 为了提高性能和 减 小 付 出 的 代 价 , 就 必 须 建 立 网 格 任 务 调 度代价数 学 模 型 。 假 设 有 R 个 节 点 分 别 为 n n 1,算 法 在 进 化 阶 段 会 造 成 粒 子 种 群 多 样 性迅速下 降 , 不 良 后 果 就 是 当 收 敛 逼 近 一 定 精 度 要 求 时 , 算法就不在继续 进 行 优 化 操 作 , 导 致 的 结 果 就 是 只 能 在 局 部实现了最 优 进 化 , 使 系 统 的 精 度 大 大 降 低 了 。 另 外 一 种 D E 算法在维护群体的多样性及搜索能力 方 面 功 能 较 强 , 并
基于Hadoop与FFmpeg的多媒体分布式处理系统的设计

基于Hadoop与FFmpeg的多媒体分布式处理系统的设计郑娟;徐刘杰;吴豹;李彪【摘要】视频媒体已经成为一种重要的网络资源,如何快速地为用户提供视频点播支持成为了一个严峻的问题.基于Hadoop分布式文件处理系统和FFmpeg音视频处理技术,构建一套分布式视频转码系统,将任意编码的视频文件转化H.264编码格式,能够实现在线实时点播;利用云端实现了用户转码请求监控、转码任务队列实时调度、运行资源分配等服务.实验证明:该系统的分布式处理有效的提高转码效率,也为资源提供了安全的分布式存储环境.【期刊名称】《安阳师范学院学报》【年(卷),期】2018(000)002【总页数】4页(P49-52)【关键词】Hadoop;FFmpeg;视频转码;分布式【作者】郑娟;徐刘杰;吴豹;李彪【作者单位】滁州学院教务处,安徽滁州23000;湖南科技学院信息技术与教育系,湖南永州425100;滁州学院计算机与信息工程学院,安徽滁州239000;滁州学院计算机与信息工程学院,安徽滁州239000【正文语种】中文【中图分类】TP391互联网媒体元素在当代社会发挥越来越重要的作用,数据产生方式由原来被动式的内容定制,变成主动式的用户原创。
在众多的网络资源中,视频媒体占据着互联网网络资源的半壁河山。
随着用户对视频资源的点播需求越来越多,通过手机、平板等各种终端来快速获取视频资源,已经成为当下一种资源获取的主流形式。
如何快速处理这些海量视频文件变得极具迫切性。
国内外相关领域的研究人士对于处理大数据提出了很多的解决方案,但是目前得到最广泛使用的是Hadoop并行计算技术[1]。
Hadoop主要包括HDFS和MapReduce两大部分[2]。
HDFS提供了完善的分布式存储方案,帮助用户分布式地存储大文件,而MapReduce是种优秀的并行程序框架,帮助用户轻松的写出分布式处理代码[3]。
为了应对越来越多的视频在线点播,万维网理事会推荐使用内置的视频标签代替传统的Flash插件进行在线视频点播。
《2024年基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》范文

《基于大数据分析的推荐系统研究——基于Hadoop的电影推荐系统的设计与实现》篇一一、引言随着互联网技术的飞速发展,大数据时代已经来临。
海量的数据资源为各行各业提供了前所未有的机遇和挑战。
在电影推荐领域,基于大数据分析的推荐系统应运而生,其能够根据用户的历史行为、兴趣偏好等数据,为用户提供个性化的电影推荐服务。
本文将介绍一种基于Hadoop的电影推荐系统的设计与实现。
二、系统需求分析电影推荐系统的核心需求是为用户提供准确的、个性化的电影推荐服务。
为此,我们需要收集和分析大量的用户数据,包括用户的观影历史、观影偏好、地域分布等信息。
同时,系统还需要对电影数据进行处理,包括电影的类别、演员、导演、上映时间等。
在系统设计过程中,我们还需要考虑数据的存储、处理、分析以及推荐算法的选择等方面。
三、系统设计3.1 技术架构设计本系统采用基于Hadoop的技术架构,包括HDFS(Hadoop Distributed File System)分布式文件系统用于存储大量数据,以及MapReduce用于处理和分析大数据。
此外,还需要使用数据库技术如HBase或Cassandra等用于存储结构化数据。
3.2 数据处理流程设计系统首先收集用户数据和电影数据,然后进行数据清洗和预处理,将数据存储到HDFS中。
接着,通过MapReduce等算法对数据进行处理和分析,提取出有用的信息。
最后,根据用户的兴趣偏好和历史行为等信息,采用合适的推荐算法为用户生成电影推荐列表。
3.3 推荐算法选择本系统采用协同过滤算法作为主要的推荐算法。
协同过滤算法可以根据用户的历史行为和兴趣偏好,找出与用户相似的其他用户,然后根据这些相似用户的喜好为用户推荐电影。
此外,我们还可以结合内容过滤算法,根据电影的内容和特点为用户推荐符合其口味的电影。
四、系统实现4.1 数据收集与预处理系统首先需要收集用户数据和电影数据。
用户数据包括用户的注册信息、观影历史、观影偏好等,电影数据包括电影的名称、类别、演员、导演、上映时间等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Radio Communications Technology
( 1, 2, 3, . . . n) , C = ( c1 , c2 , . . . cn ) , m 个不同处理 P = ( p1 , p2 , . . . pm ) , 能力的计算节点, 若转码时间 与机器处理能力成反比, 与视频块的复杂度成正比, 则视频块 i 分发到机器 j 上的转码时间为 ( 只考虑 转码时间, 其余负载均忽略) :
摘 要: 现 有 的分 布 式 转 码 系 统 大 多 没 有 考 虑 到 根 据 计 算 节 点 的 处 理 能 力 分 配 转 码 任 务 量 , 对转码过程造成影 响, 导致 转 码 效 率 降低 。 针 对这 一 问题 , 在 对现 有 Max-Min 算 法 的 研 究 基 础 上, 提 出 一 种 新 的 任 务 调 度 算 法。利 用 佩 奇排 名 算法 评 估机器 转 码 性 能 , 输入 视 频 被 分 成大小 不 同 的 段 , 依 据 其 复 杂 度 和 机器 的 转 码 能 力 进 行 映 射 。 处 理 能 力 强 的 节点 将 分 配 到 更 多的 视 频 块 , 最 终 所 有计 算节点 的 完 成 时 间 得到 均衡 化 。 实验结 果表明 , 该算法能够显著提升视 频转码效率, 在 很 大程 度 上 改 善 了 云 转 码 系 统 。 关键词: 分布式转码; 任务调度; 佩奇排名; 均衡化 中图分类号: TN92 文献标识码: A 文章编号: 1003 - 3114 ( 2014 ) 02 - 63 - 4
图2
视频转码框架图
图1
云计算框架
视频转码 视频技术和视频压缩标准的不断发展以及视频 节目在不同应用环境的需要, 促使了视频转码研究 的出现和不断发展。转码的主要目的就是使得异质 网络之间、 不同的接入设备之间以及不同视频数据 格式之间能够互相兼容。视频转码主要有以下几种 类型: 码率转换( Bitrate reduction ) 、 空间分辨率转换 ( Spatial reduction) 、 时间分辨率转换 ( Temporal resolution reduction) 和语法转换等[6]。 视频转码的过程是: 对原始视频进行解码、 重新 调整和视频编码。 在网络视频应用中, 网络带宽随 着时间波动。视频转码的主要用途是使视频适应于 网络带宽, 类 似 于 可 伸 缩 视 频 编 码 ( scalable video [7 ] coding) 。视频压缩的标准格式有多种, 如 MPEG1、 MPEG2、 H. 263 、 MPEG4 和 H. 264 等。 1. 3 云转码方案 首先提出一种基于 hadoop 的视频转码框架, 如 通过 图 2 所示。 视频由 mkvtoolnix 软件进行切片, MapReduce 中的 map 函数封装 ffmpeg 转码功能, 当 1. 2 64
基于 Hadoop 视频转码的任务调度算法
1 1, 2, 3 4 , 毕莎莎 , 陈清华 高煜红
( 1. 南京工业大学 电子与信息工程学院, 江苏 南京 210009 ; 2. 浙江清华长三角研究院, 浙江 嘉兴 314006 ; 3. 北京大学软件与微电子学院, 北京 102600 ; 4. 浙江工业大学 信息工程学院, 浙江 杭州 310023 )
视频转码分为离线预转码和在线转码, 系统处 理一个 普 通 的 用 户 的 视 频 请 求 可 分 为 以 下 几 个 步骤: ① 视频请求: 用户从远端向 Web Server 发送获 取视频的请求, 包括视频名称与用户设备规格; ② 设定参数: Web Server 根据用户设备参数及 所 要 求 的 分 辨 率, 向 Streaming Server 请 求 视 频 资源; ③ Streaming server 检查 Prestore video data 中是 否有与用户请求相匹配的数据; Streaming Server 从 Prestore video da④ 若存在, ta 中取出视频数据; ⑤ 将视频块返回给用户; ⑥ 否 则 向 NameNode 发 出 转 码 任 务 的 命 令, NameNode调度集群进行分布式转码; 分布式转码完 NameNode 向 Streaming Server 返回转码完成 成后, 后的视频文件所在位置 Transcoded video data; ⑦ Streaming Server 从 Transcoded video data 中 读取视频文件; ⑧ 将视频块返回给用户同⑤。
2
2. 1
关键技术
问题模型 此处要考虑的是如何快速地把复杂度不等的子 任务调度到多个处理能力不一致的处理节点上 。文 8] 献[ 比较了 11 种调度算法的执行效率, 发现 MinMin 算法与其相比, min 效率最高。 但是 Max资源 Min 算法把所有节点的 负载性能上要好的多。Max完成时间进行平均化, 从而减少了转码时间, 提高转 码效率。 [9] 首先把资源的动态分发问题建立数学模型 : 假设: 有 n 个具有不同复杂度的视频段,J =
2014
年第 40 卷第 2 期
无线电通信技术
针对现有视频转码系统大多没有考虑到根据机 器处理能力分配转码任务量这一问题, 提出一种新 根据视频段 的任务调度算法。 输入视频被分成段, 的复杂度和机器的处理能力进行映射, 类似“能者 ” , 。 多劳 机制 从而减少并提交到集群时, 到集群节点上, 利用集群系统的计算能力和已有视 频转码开源软件实现多视频同时转码 。
1
1. 1
Hadoop 转码系统
Hadoop 介绍 Hadoop 是一个 开 源 的 云 计 算 框 架, 如图 1 所 是一个适合处理海量数据的并行编程系统 , 可以 示, 根据输入数据分布信息自动创建几个并行子任务 , 并将子任务调度到合适的集群节点上并行执行 , 所 以此模型能够很好地适用于多个视频文件进行转 Map / 码。Hadoop 使用 Map / Reduce 作为编程模型, Reduce 通过将大型分布式计算分解为一系列对数 据键值对的 操 作 实 现 并 行 处 理。 HDFS 是 Hadoop 主要的分布式存储系统, 它和现有的分布式文件系 统有许多相似之处。 HDFS 的设计目标是: 支持大 的数据文件, 这些文件以顺序读为主, 以文件读的高 并且与 Map / Reduce 框架紧密结合。 吞吐量为目标,
0
引言
网络视频已成为人们生活中不可或缺的一部 美国有将近 90% 的人通过网 分。截止到 2012 年, [1 ] 络获取高清视频 , 如何保证各种移动终端得到不 提供可靠的服务面临严峻的挑战 。 同的服务质量, 视频转码就是从一种视频码流到另外一种码流
收稿日期: 2013 - 12 - 20 基金项目: 江苏省基础研究计划资助项目( BK2010137 ) , 浙江省十二 五重 大 科 技 专 项 ( 2012C01037 - 1 ) ; 嘉 兴 市 科 技 计 划 项 目 ( 2011AZ1013 ) 作者简介: 毕莎莎( 1989—) , 女, 硕士生。主要研究方向: 分布式转码。 陈清华( 1968 —) , 男, 博士, 教授, 硕士生导师。 主要研究方向: 并行 计算、 云计算及应用、 网络通信等。
的转换, 目的是把输入的压缩流转换成符合接收端 要求的压缩流。随着视频数据量的急剧增长, 传统 存储能力和处 的视频转码系统存在存储能力不足、 研究人员提出多 理能力不可扩展的缺点。 近年来, [2 - 5 ] , 用来提高转 种基于 Hadoop 的视频转码系统 2] 码效率。文献[ 在集群机器配置完全一样的情况 下, 把视频分别按时间、 机器数目和视频相关性分 3] 进行了 3 组对比实验; 文献[ 提出了一个面向 段, 引入了视频资源预测与缓 移动设备的云转码系统, 4]利用开源软件 Vmoox 设 冲区置换的算法; 文献[ 5]根 计了一个面向智能手机的转码系统, 而文献[ 据视频切片大小、 不同的机器节点数和 Hadoop 本身 的 block 大小进行对比实验。 63
Scheduling Algorithm Based on Video Transcoding Using Hadoop
2, 3 BI Shasha1 , CHEN Qinghua1, , GAO Yuhong4
( 1. College of Electronics and Information Engineering, Nanjing University of Technology, Nanjing Jiangsu 210009 , China; 2. Yangtze Delta Region Institute of Tsinghua University, Jiaxing Zhejiang 314006 , China; 3. School of Software and Microelectronics,Peking University, Beijing 102600 ,China; 4. College of Information Engineering, Zhejiang University of Technology, Hangzhou Zhejiang 310023 , China) Abstract: Allocation videos in accordance with the processing capacity of computing nodes has a significant impact on transcoding performance, which is currently not taken by most existing distributed transcoding systems into account, resulting in degradation of transcoding efficiency. To address this problem, based on the research of existing scheduling algorithm MaxMin, a modified algorithm is proposed. This paper used a PageRank to evaluate the computer performance. Input video sequences are divided into segments, and it would average mapped to multiple computers. Computing nodes with higher handling abilities will get more video segments. Obviously, the finish time of the computers. Experimental results show that the proposed algorithm can achieve performance improvement of and enhance distributed transcoding system to a large extent. transcoding efficiency, Key words: distributed transcoding; task scheduling; PageRank; load balance