板材轧制快速有限元在线计算测试分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
情况见表 3 。 由表 3 叮 - m - a n h w r e 知, k p lu c - o k r和 一m c f r — kp—ok
c l 均隶属 于 L g ie 0 d a l iud4 .l l模块 ,该模 块是 在并行 程 序启动 后被 调用 的 ,是并行程 序开 发 、运 行 时必不 可少 的模块 之一 。两者 分别在 启动 并行功 能和调用 函
数 时起到作用 。kp lu c-ok r函数被调用 1次 , m-an hw r e 总共 耗 时 1 1 3 s 98 7 36m ,其 中 自我 执 行 507 84 5 1
m ,调用其 他 函数耗 时 1 5 2 s s 4 79 5 2 m ,这说 明该 函 数 耗 时 的 原 因在 于 调 用 其 他 函 数 的 过程 上 。 N W iF r ig e b e t是 3 t a t o S n lO j c 2位 处 理 器 中 受 It l n e
耗 时间的子程序是H S i i 阵以及计算塑性变形功率和摩擦变形功率 的子程序。C U e S Ol 矩 P 核数的增加有助 于减 少程序运行 的计算 时间。计算过程 中最耗时间的函数均是 系统 自带的无法进行更 改,应尽可能地减少调用 它 们 的次数 以降低 时间损耗。
关键词 : 板材 轧制 ;快速有 限元 ;在线计算;性能测试
发生事件数
‘ 3 0 0 0 7 52 0 0 0 0 4 7 0 0 9960000
取样次数
l 5 87 l 2 8 498
取样总次数
1 5 923 2 0 529
所 占比例 () %
9.9 7 3 9.2 9 1
平均时钟周期
07 .5
2 F E性 能测试 分析 F 2 1 取样分析 .
取样 分为基 于 时间取样 和基 于事件 取 样两种 ,其 原理 都是通 过使 用 C U内部 的监视 功 能来检 测系 统底 P
对 实现 高精度 带钢 轧制具 有重 要 的理论意义 并具 有实
际应用 价值 。针对 这种情 况 ,东北 大学 、燕 山大 学与
1 板材轧 制过程 刚塑性有 限元快速 算法 实现 板材 轧制过 程刚 塑性 有 限元求 解快 速算 法涉及 到
泰 国家 自然科 学 基 金 资 助 项 目 (0 3 0 0 554 2 )
收稿 日期 :2 1 - 4 0 ;修 回 日期 :2 1- 4 1 0 10 — 2 0 10 — 0
中图分类号 : G 3 . T 3 55 文献标识码 : A
0 引言
快速 有 限元 方法 (F ) F E 具有 求解 精 度 高 、速度 快
模 型简化 和关 键 问题 处理 、初 始速度 场 设定 、一维 线 性搜 索 、并行 处 理和 软硬 件平 台优 化 等 [。将这 些算 6 ]
CU P ,计 算机 操作 系 统无 法将 正 在等 待 的线程 任 务 分 配 到另一个 闲置 的 CU中,因而 调用过 多 的线 程只会 P 消耗 时 间 , 占用 系统 资源 ,对程 序 的运行 反 而不 利 。 因此 ,在多核计 算机 上计算 时 ,程 序设 置 的 CU数量 P 不能大于机 器 自身 的核数 。
法进 行优 化组 合得到 的 刚塑性有 限元 快速 算法 流程 图 见 图 1 。
的优 点 ,实现 F E 方法 在 线 应 用 是一 项 颇 具 良好 发 F 展 前景 和挑 战 性 的研 究课 题 ] 。近 年 来 ,F E 在 轧 F 制工程领 域得到 了广泛应 用 [ ] F 3 ,F E方法 的在线 应用 “
层 的各种性 能事件 ,在 一 定数量 的事件 发 生之后 中断 处理 器 ,同时将运 行信 息记 录到 一个缓 冲 区 ,当缓冲 区记 录 已满 时 ,将 信 息复制 到文件 中,保存 好这 些信 息后 程 序 再 重 新 开 始 运 算 。F E进 程 取 样 如 表 1所 F
刁 o
2 2 调 用曲线 图分析 .
调用 曲线 图是通过 分析程 序运行 时 函数 的入 口点 和 出 口点 ,确 定 调 用顺 序 和 关 键 路 径 ,显 示 线 程 创 建 、函数执 行 以及它 们之 间的父 子继 承关系 ,帮助 开
发者快速识别其主要功能和调用顺序 。FE F 有限元程 序 为多线程工 作 ,在 各个线 程 中最 耗 时间 的函数调用
行 数 共发 生 4 7 0 0 9 9 6 0 0 0 0个事 件 ,被 取 样 2 " 4 98 8
对板材 轧制快速 有 限元在 线计算进 行 了性能 测试 与分
析。
次 , 占整 个系 统 机 器 周 期 的 9 . 2 ,而 平 均 时钟 周 9 1%
期 (P ) 占 了 0 7 。前 两 者说 明在 该 时刻 ,计算 机 C I只 .5 运 行 的所 有进 程 中,有 限元程序 的进 程 占用 了系统 的 绝 大部 分 内存 资源 ,而 C I P 指数 则说 明 了程 序 当 时调
但 有 一 个 线 程 (h e d ) 未 理 想 地 投 入 运 行 , 而 Tra 1 并
Tr a2非停 机状 态下 的机 器 周期和 指令 有效 执行 数 h ed
在 F E进程 的线程 取样 中分别 占到 了 9 . 9 和 l0 。 F 9 9 % 0 % 分析 原 因是 由于在 该次测试程 序 过程 中只设置 了一 个
刘 莹。等 :板材轧制 快速有 限元在 线计算测试 分析
・9 ・
2 3 计数 器监控 器分析 .
无法 得到 完全 的发 挥 。为提 高程序 的 CU使 用率 ,可 P 以考 虑在 多核计 算 机执行 多 线程来 解决 该 问题 。从 图 2b 可 以看 到 ,采用 双核 多线程 使程 序 的 CU的使用 () P
模块
L b u d 4 . l igie0dl L b u d 4 . l igie0dl
函数
— m — an h w r e k p l uc - o k r — mp — o k — al ’ c r — k f c l
自我执行 时间(S m)
5 0 7 81 5 4 1 0 7 5 5 6 6
板材 轧制 快速 有 限元在 线计 算测试分 析米
刘 莹 , 王 炳 德
( 北 大 学 机 械 工 程 与 自动 化 学 院 , 辽 宁 沈 阳 10 0 ) 东 1 0 4
摘要 : 采用I t 1 V u eA al z r 对板 材轧制快速 有 限元在 线计算进行性 能测试 与分析 ,研 究 了影响 n e T n n y e s 程序计算速度 的关键 因素 ,以期对实际生产 监控提供指 导。测试分 析结果表 明:程序 的并行化程度较好 ,最
第4 ( 期 总第 17期 ) 6 2 1 年 8月 01
机 械 工 程 与
自 动 化
No. 4
M ECH A N I CA L EN G I E ER I G & A U TO M A TI N N N O
Au g.
文章 编 号 :6 2 6 1 2 1 )0 — 07 0 1 7 — 4 3( 0 1 4 0 0 — 4
用 。本文 采用 I t l V u e A a y e s 性 能分 析器 ) n e T n n lz r (
从表 l 中可 以看 出 ,每个 程序 的启 动都会 触 发一 个 进程 的执 行 。从板材 轧制快 速有 限元 在线 计算程 序 的进程 被启 动到 结束 ,非停机 状态 下花 费 的机 器 周期 前 后 共发 生 3 0 0 0 事件 ,被 取 样 1 5 7 5 2 0 0 0 0个 871 次 , 占整 个系 统 机 器 周 期 的 9 . 9 ;指 令 的有 效 执 73%
系 统 内核 函数 。
多线程 的作用 是 同时使 用多个 线程工 作 以完成 多 个 任 务 ,提 高 系统 的工 作 效 率 。表 2为 F E线 程 取 F
样 。从表 2可 看 出 ,虽然 FE进 程 启动 了两 个线 程 , F
表 1 F E 程取 样 F进
测试事件
非 停 机 状 态 下机 器 周 期 指令的有效执行数
V ue性能 分析 器 支持 的同 步 函数 ,属 于 N DLd l Tn TL. l
图 1 板材轧制过程刚塑性有限元快速算法流程 图
模块 ,该模 块是 N (e eh ooy操 作系统 的重要 T Nw Tc nlg ) 模 块 ,是 系统的 D LDnm cLna l irr ,动 L (ya i ik beLbay 态 链接库) 文件 ,许 多 CT模 拟接 口) R( 的基 本 函数 均属 于该模块 ,用户模 式 的代 码必 须通过 该模块 才能调 用
率得 到 了很大 的提 高 ,但 在 0 m  ̄2 0 s范 围 内信 s 0 0m 息仍有 阻塞 现象 存在 ,原因在 于程序 刚被 执行 时 ,有 大量 的动态 链接 库及 有关 系统程 序被 调用 ,与 其 它进
计 数 器 监 控器 分 析 结 果 如 图 2所 示 。 从 图 2 a () 中可 以看 到 ,程 序运 行 时进 程 资 源 的利 用 并 不 理 想 , C U的使 用 率 只有 4 % 右 ,属 于一 个 偏 低 的值 。这 P 9左 是 因 为有 限元 程 序 只 调 用 了一 个 线 程 来 执 行 程 序 代 码 ,当程 序进 程 以 同步 的方 式去 完成 多 个任 务时 ,进 程 会根 据 C U分配 的 时间片 段逐 个执 行任 务 ,这样 就 P
得到广 泛使用 ,机器 的峰 值性 能不 断提高 。但是 实际 上应用程 序获 得 的持续性 并未 随机器 峰值性 能 的提 高 而 同比例提 高,两者 差距 目益扩 大 。程 序性 能优 化是 解决该 问题 的有效途 径之 一 ,而 性 能测试是 理解程 序 行 为的基础 ,对 识别 程序 性 能瓶 颈 、 了解软 /硬件 资 源利用情 况和程 序对 机器 性能 的发挥程 度具 有重要 作
总时间 (s m)
1 7 3 6 9 8l 3 1 3 5 43385
调用次数
1 l
N D Ld 1 T L . l
N W iF r ig e b e t t a t oS n lO j c 2 7 7 27525来自2 7 7 27525

2 1 年第 4期 01
所 占比例 () % 0 0 .1
9. 9 99
平均机器周期 0 7 .8
0 7 .5
Tra l h e d
Tra2 h e d

4 9 6 0 0 0 0 9 7 0 0

2 8 4 98

10 0
0 7 .8
O 7 .5
表 3 各 个 线 程 中 最 耗 时 间的 函数 调 用 情 况
中科 院金属研 究所共 同开发 了板材 轧制过程 中有 限元 高速在线 计算 F E算法和 程序 。 F 要使快速 有 限元程序 在生产 现场 顺利应 用 ,不仅 应考虑 计算机 软硬件 平 台等 的影响 ,还应考 虑程序 性
能 的影响 [。近 年来 ,各 种 高性 能计算 机 不 断涌现 并
表 2 F E线程 取 样 F
测试事件 非停机状态下 的机器周期 指令 的有效执行数 Tr a l h e d
T re d h a2
发生事件数 4O o 0 0 o 0
3 5 2 0 0 7 0 0 0 0 0
取样次数 2
1 7 9 8 4
取样 总次数 1 5 87 1 2 8 498
作者 简 介 :刘 莹 (9 5 ) 女 , 宁 海 城 人 , 师 . 科 , 要研 究 方 向 : 属 成 型 工 艺 。 16 一 , 辽 讲 本 主 金
・8 ・
机 械 工 程 与 自 动 化
2 1 年第 4期 01
用浮 点数操 作 、乘 除法 、i o处理 、系 统调 用和 文件 / 访 问等消耗 大量 内存的操 作总体 上较少 ,处在 C I良 P 性取值 范围之 内。
相关文档
最新文档