基于视线追踪的增强现实人机交互方法

合集下载

人机交互中眼动追踪技术的应用案例分析

人机交互中眼动追踪技术的应用案例分析人机交互是指计算机与人之间进行信息交流和交互的过程。

随着科技的不断发展，人机交互技术也得到了极大的改善和完善。

其中，眼动追踪技术作为一种非常重要的交互方式，被广泛应用于各个领域。

本文将通过分析一些眼动追踪技术的应用案例，介绍眼动追踪技术在人机交互中的价值和意义。

首先，眼动追踪技术在用户界面设计中起到了重要的作用。

用户界面设计是人机交互的核心领域之一，它直接影响用户对系统的使用体验。

眼动追踪技术可以帮助设计师了解用户对界面的关注点和注意力分布，从而优化界面的布局和设计。

例如，在网页设计中，通过分析用户的眼动轨迹，设计师可以确定最吸引用户注意力的位置，进而调整页面的元素排布，使得用户更容易找到他们感兴趣的内容，提升用户的使用体验和满意度。

其次，眼动追踪技术在用户调查和市场研究中也发挥着重要的作用。

传统的用户调查方法往往依赖于用户的反馈和自我陈述，存在主观性和不准确性的问题。

而眼动追踪技术可以直接记录用户在使用产品或观看广告时的注意力分布和行为轨迹，提供客观的数据和分析。

这种数据可以帮助企业了解用户的偏好和行为模式，从而做出更准确的市场决策。

比如，在广告研究中，通过分析眼动追踪数据可以评估广告的效果和吸引力，帮助广告商优化广告内容和布局，提高广告的点击率和转化率。

此外，眼动追踪技术还被广泛应用于虚拟现实（VR）和增强现实（AR）等领域。

在虚拟现实中，通过追踪用户的眼动可以触发系统的反馈，比如变化的景色、移动的物体等，增强用户的沉浸感和互动性。

这种技术可以应用于游戏、教育、医疗等领域，提供更真实、更个性化的体验。

在增强现实中，眼动追踪技术可以帮助用户更准确地选择和操作虚拟物体，提高增强现实应用的交互效率和便利性。

此外，眼动追踪技术还在驾驶辅助系统中得到了广泛应用。

驾驶过程需要司机持续关注前方道路和交通信息，而眼睛是司机获取信息的重要渠道。

眼动追踪技术可以监测司机的注意力分布，提醒司机及时注意到潜在危险和疲劳驾驶等问题。

视线跟踪技术在人机交互中的研究

摘要：人们在观察外部世界时眼睛总是与其它人体活动自然协调地工作,并且眼动所需的认知负荷很低,人眼的注视包含着当前的任务状况以及人的内部状态等信息,因此眼注视是一种非常好的能使人机对话变得简便、自然的候选输入通道.本文介绍了视线跟踪的基本原理、方法,对视线跟踪作为人机交互通道所具有的特点进行了讨论,并指出了其在人机交互领域中的应用及前景.关键词：人机交互;视线跟踪;多通道用户界面目前用户界面所使用的任何人机交互技术几乎都有视觉参与。

早期的视线跟踪技术首先应用于心理学研究(如阅读研究)，后被用于人机交互。

眼动在人的视觉信息加工过程中，起着重要的作用。

它有三种主要形式：跳动(Saccades), 注视(Fixations)和平滑尾随跟踪( Smooth Pursuit)。

在正常的视觉观察过程中，眼动表现为在被观察目标上一系列的停留及在这停留点之间的飞速跳动，这些停留一般至少持续100ms以上，称为注视。

绝大多数信息只有在注视时才能获得并进行加工。

注视点间的飞速跳跃称为眼跳动。

眼跳动是一种联合眼动（即双眼同时移动），其大小为1到40 度视角，持续时间为30到120ms，最高运动速度为400-600度/秒。

视线跟踪精度与在测量时对用户的限制和干扰就是一对矛盾.在多通道用户界面设计中，减少这种限制和干扰是非常重要的,视线作为交互装置最直接的用处就是代替鼠标器作为一种指点装置。

一、视线跟踪的基本原理、方法视线跟踪技术及装置有强迫式（intrusiveness）与非强迫式(non-intrusiveness)、穿戴式与非穿戴式、接触式（如Eyeglass-mounted）与非接触式(Remote)之分；其精度从0.1°至1°或2°不等，制造成本也有巨大差异。

在价格、精度与方便性等因素之间作出权衡是一件困难的事情，例如视线跟踪精度与对用户的限制和干扰就是一对尖锐的矛盾。

有关视觉输入的人机界面研究主要涉及两个方面:一是视线跟踪原理和技术的研究;二是在使用这种交互方式后,人机界面的设计技术和原理的研究.眼睛能平滑地追踪运动速度为1到30度/秒的目标，这种缓慢、联合追踪眼动通常称为平滑尾随跟踪。

人机交互技术中的眼动跟踪技术应用教程

人机交互技术中的眼动跟踪技术应用教程人机交互技术是指通过人与计算机之间的交互来实现信息的传递、控制和操作。

眼动跟踪技术作为人机交互中的重要组成部分，可以追踪和记录用户的眼球运动轨迹，为用户提供更加便捷和高效的交互方式。

本文将介绍眼动跟踪技术的基本原理、应用场景以及相关设备和软件的选择与使用方法。

一、眼动跟踪技术的基本原理眼动跟踪技术通过追踪和记录用户眼球运动轨迹来获取用户的视觉注意点，从而能够获得用户在屏幕上的注视位置和时间。

其基本原理是通过红外光或视频传感器对用户的眼球进行精确捕捉和追踪。

眼动跟踪技术主要包括以下几种方式：1. 视网膜追踪：利用红外光源发射红外光在眼睛周围形成反射点，摄像机通过红外传感器捕捉到这些反射点的位置信息，并通过计算来确定用户的注视位置。

2. 瞳孔追踪：通过红外光源或者摄像机捕捉到用户眼睛瞳孔的位置和大小信息，通过计算来确定用户的注视位置和注视时间。

3. 视角追踪：通过多个摄像头捕捉到用户看向屏幕时的视角变化，通过计算来确定用户的注视位置。

二、眼动跟踪技术的应用场景1. 用户体验研究：眼动跟踪技术可以用于评估用户对软件、网页等界面设计的使用体验，通过分析用户的注视点和注视时间，改进界面设计，提升用户体验。

2. 用户行为分析：眼动跟踪技术可以用于分析用户在使用计算机和手机等设备时的行为习惯和偏好，为产品设计和市场营销提供参考依据。

3. 医学研究：眼动跟踪技术可以用于医学研究领域，如眼动分析用于研究人类的认知过程，眼动追踪技术在眼科疾病的早期诊断等方面有着广泛的应用价值。

4. 精准广告投放：通过分析用户的注视点和注视时间，可以对用户的兴趣和喜好进行分析，帮助广告商实现更精准的广告投放。

三、眼动跟踪技术的设备选择和使用方法1. 眼动跟踪设备的选择：根据具体的应用需求和预算情况，可以选择桌面眼动仪、移动眼动仪或虚拟现实眼动仪等不同类型的设备。

需要考虑设备的准确度、采样速率、适用范围等因素。

人机交互测试中的眼动追踪技术应用(一)

人机交互测试中的眼动追踪技术应用一、引言随着科技的不断进步和人机交互技术的快速发展，眼动追踪技术逐渐应用于人机交互测试中，以评估用户对界面的理解和反应。

眼动追踪技术能够实时捕捉被测试者的视线轨迹，为评估用户体验提供了全新的方法。

二、眼动追踪技术的原理眼动追踪技术通过眼动仪实时记录用户的视线轨迹，并将其转化为数据，以便分析用户在特定任务中的注意力分配。

该技术的主要原理是通过探测眼球的运动轨迹来捕捉用户的注视点和注视时间。

眼动仪通常由红外摄像头和光学系统组成，可以高精度地追踪眼球运动。

三、眼动追踪技术在用户界面评估中的应用1. 了解用户注意力分配眼动追踪技术能够帮助研究人员了解用户在特定任务中的注意力分配情况。

通过分析眼动数据，可以获得用户的注视点、注视时间、扫视路径等信息。

根据这些信息，研究人员可以确定用户在使用界面时的注意力集中点，从而优化界面设计和用户体验。

2. 评估界面布局和信息组织眼动追踪技术可以帮助研究人员评估界面的布局和信息组织方式。

通过分析用户的注视点和扫视路径，可以确定用户对界面不同部分的关注程度。

如果用户的注意力分散或者存在盲区，那么研究人员可以对界面进行适当调整，以提升用户体验。

3. 检测用户认知负荷眼动追踪技术可以实时检测用户的认知负荷，即用户在执行任务时所面临的认知需求和压力水平。

通过分析眼动数据中的扫视路径和注视时间，可以了解用户在处理任务时的认知负荷变化，从而判断任务的复杂程度和用户的认知疲劳程度。

四、眼动追踪技术在交互设计中的应用案例1. 移动设备界面设计在移动设备界面设计中，眼动追踪技术可以帮助设计师确定用户对不同功能区域的关注程度，以及用户执行任务时的注意力分配情况。

通过分析眼动数据，设计师可以优化界面的布局和交互方式，提升用户的操作效率和体验。

2. 虚拟现实交互界面设计在虚拟现实交互界面设计中，眼动追踪技术可以帮助设计师了解用户视线在虚拟场景中的移动轨迹和注意力区域。

眼动跟踪技术在人机交互中的应用研究

眼动跟踪技术在人机交互中的应用研究近年来，随着科技的不断发展，人机交互技术也得到了越来越广泛的应用。

其中，眼动跟踪技术就是一种常见的人机交互技术，它可以通过追踪用户的眼睛运动来进一步理解用户的需求和反应，从而更好地进行人机交互。

眼动跟踪技术最初应用于眼科医学研究，以探讨人眼运动特点和眼部疾病。

随着计算机技术的不断发展，眼动跟踪技术也被应用于人机交互。

眼动跟踪技术在人机交互中的应用主要分为以下三个方面：一、科学研究领域眼动跟踪技术在感知心理学、认知心理学、行为学、心理生理学等领域均有广泛应用。

通过追踪用户的眼睛运动，我们可以更好地研究他们的注意力、记忆、思考和情感状态等方面的行为，进而深入探讨人类认知和行为的本质。

例如，在用户使用计算机进行复杂任务时，可以通过追踪用户的眼睛运动，了解用户在何时、何处出现注意力涣散、疲劳倦怠等状态，为设计更好的人机交互界面提供依据。

二、智能家居领域随着智能家居技术的不断发展，人机交互方式也在逐步改变。

眼动跟踪技术可以将用户的眼睛视为一个交互设备，通过用户的注视位置和注视时间来控制家居设备的运行。

例如，当用户眼睛注视厨房的咖啡机时，智能家居系统就提示用户在当前位置有可饮用的咖啡，方便用户及时获取咖啡。

三、虚拟现实领域虚拟现实技术是近些年来备受推崇的技术之一，它可以为用户提供更真实的交互体验。

眼动跟踪技术也在虚拟现实领域中得到了广泛的应用。

通过追踪用户的眼睛运动，可以更准确地确定用户所在的视线方向，并通过虚拟现实设备向用户呈现更真实的体验。

总之，眼动跟踪技术在人机交互中的应用已经逐渐成为了人们关注的热点问题，随着科技的不断发展，它将在更多领域得到应用。

同时，随着人们对信息交流和处理的需求不断提高，人机交互技术的市场也将不断扩大，带动眼动跟踪技术的发展。

眼动追踪技术在人机交互界面设计中的优化方法探索

眼动追踪技术在人机交互界面设计中的优化方法探索随着科技的不断进步，人机交互界面设计的重要性也日益凸显。

而眼动追踪技术作为一种新兴的交互技术，为人机交互界面设计带来了许多新的优化方法。

本文将探索眼动追踪技术在人机交互界面设计中的优化方法，并探讨其在提升用户体验和效率方面的潜力。

首先，我们需要了解眼动追踪技术的基本原理。

眼动追踪技术通过红外光和摄像设备来追踪用户眼球的运动，从而获取用户在屏幕上关注的区域。

通过分析眼动追踪数据，我们可以了解用户在界面上的注意力分布和视线轨迹，从而更好地理解用户的认知过程和交互行为。

在人机交互界面设计中，优化方法的核心目标是提升用户的可用性和工作效率。

眼动追踪技术可以通过以下几种方式实现这一目标：首先，我们可以利用眼动追踪数据来改进界面的布局和视觉呈现。

通过确定用户的注意力焦点，我们可以将界面元素进行优化放置，使得用户更容易找到关键信息或操作。

同时，根据视线轨迹的特征，我们可以通过改变颜色、字体大小或动画效果等方式来引导用户的视觉关注，从而提高界面的可用性。

其次，眼动追踪技术可以应用于界面的交互设计。

通过分析用户的眼动数据，我们可以了解用户在交互中的注意力焦点和意图。

基于这些信息，我们可以设计出更精确的交互响应机制，提供更好的用户反馈。

例如，在多选列表中，通过确定用户目光停留的位置，我们可以预测用户的选择，并在用户选定后立即给出相应的反馈，进一步提高用户的工作效率。

此外，眼动追踪技术还可以用于用户行为分析和界面优化。

通过分析用户在界面上的注意力分布和视线轨迹，我们可以了解用户对不同界面元素的关注程度，进而评估界面设计的有效性。

基于这些评估结果，我们可以进行界面元素的调整和优化，以提供更符合用户需求和偏好的界面体验。

然而，眼动追踪技术在人机交互界面设计中仍然存在一些挑战和限制。

首先，眼动追踪设备的成本较高，限制了其在普通消费级产品中的应用。

其次，用户的眼动数据可能受到环境条件、疲劳程度等因素的影响，进而导致数据的准确性下降。

《基于深度学习的视线跟踪算法研究》

《基于深度学习的视线跟踪算法研究》一、引言视线跟踪技术是一种通过捕捉和解析人眼视线方向的技术，其在人机交互、智能驾驶、虚拟现实等领域有着广泛的应用。

近年来，随着深度学习技术的飞速发展，基于深度学习的视线跟踪算法逐渐成为研究热点。

本文将介绍基于深度学习的视线跟踪算法的研究背景、意义及现状，并探讨其技术原理和实现方法。

二、研究背景与意义视线跟踪技术能够实时捕捉和解析人眼的视线方向，为智能系统提供了更自然、更直观的人机交互方式。

在人机交互领域，基于深度学习的视线跟踪算法可以显著提高交互的准确性和效率；在智能驾驶领域，该技术可以辅助驾驶员更好地监控路况，提高行车安全；在虚拟现实领域，它则为用户提供了更加沉浸式的体验。

因此，基于深度学习的视线跟踪算法的研究具有重要的理论价值和实际应用意义。

三、技术原理与实现方法1. 特征提取：深度学习算法通过训练大量的图像数据，自动学习和提取图像中的特征。

在视线跟踪中，特征提取主要针对人眼图像进行，包括瞳孔、眼角等部位的定位和特征提取。

2. 模型构建：基于深度学习的视线跟踪算法通常采用卷积神经网络（CNN）构建模型。

模型通过学习大量的人眼图像数据，建立人眼特征与视线方向之间的映射关系。

3. 训练与优化：通过大量的训练数据对模型进行训练，不断优化模型的参数，提高模型的准确性和泛化能力。

同时，采用损失函数对模型的输出进行评估，确保其符合实际需求。

4. 实时跟踪：在实际应用中，通过摄像头实时捕捉人眼图像，将图像输入到训练好的模型中进行处理，得到人眼的视线方向。

同时，通过不断更新模型以适应不同的人眼特征和光线条件。

四、研究现状与进展目前，基于深度学习的视线跟踪算法已经取得了显著的成果。

研究者们通过改进模型结构、优化训练方法等方式，不断提高算法的准确性和实时性。

同时，随着硬件设备的不断发展，如高性能的GPU和专用芯片等，为视线跟踪算法提供了更好的计算支持。

此外，多模态融合技术也将视线跟踪与其他生物特征识别技术相结合，提高了系统的整体性能。

基于人眼追踪技术的人机交互界面设计与实现

基于人眼追踪技术的人机交互界面设计与实现随着人工智能和计算机技术的快速发展，越来越多的人机交互界面应运而生。

不断探索和改进人机交互的方式，成为了人们持续追求的目标。

其中，基于人眼追踪技术的人机交互方式，得到了广泛的关注。

本文将讨论基于人眼追踪技术的人机交互界面设计与实现。

一、人眼追踪技术的原理与应用人眼追踪技术是一种通过计算机识别人眼的运动和行为，从而控制计算机功能的技术手段。

人眼追踪技术广泛应用于人机交互、生物医学、娱乐和教育等领域。

其中，人机交互是应用最为广泛的领域之一。

在人机交互方面，人眼追踪技术可以实现基于目光的控制，加强用户与计算机之间的交互体验和互动效果。

同时，人眼追踪技术也可以检测用户的行为和心理状态，进一步帮助改进界面和交互设计的效果。

二、基于人眼追踪技术的人机交互界面设计1. 界面设计基于人眼追踪技术的人机交互界面设计，应该考虑人眼追踪技术的特点和用户的特性，确定合适的应用场景，并针对人眼追踪的信息进行界面设计和改进。

在界面设计方面，一些常见的设计策略包括：减少冗余空间和信息，增加预测功能、人机交互的反馈和提示提示等。

2. 交互实现基于人眼追踪技术的人机交互实现需要一个成熟的算法，从而实现对用户目光的追踪、识别和分析。

与此同时，也需要考虑实现系统的应用场景、用户设备和交互模式等因素。

在交互实现方面，一些常见的技术方案包括：采用基于光学的技术实现人眼追踪、结合其他感知技术实现更加准确的识别和判定、加强交互反馈、探索眼动模式等等。

三、案例分析1. 微软公司的Xbox游戏机微软公司的Xbox游戏机是一款基于人眼追踪技术的游戏控制器。

Xbox Kinect控制器允许玩家使用他们的身体动作和语音命令来与游戏进行互动。

这种游戏控制器使用一个视觉传感器来跟踪玩家的身体运动和声音，将玩家的动作映射到游戏角色上，使得游戏体验更加流畅。

2. Tobii公司的多功能眼动仪Tobii公司的多功能眼动仪是一款高度灵活和全面的人眼追踪设备。

眼动追踪技术在人机交互中的应用

眼动追踪技术在人机交互中的应用眼动追踪技术（eye-tracking technology）是一种用来追踪人的眼珠运动并记录其注视屏幕上的不同点的技术。

在过去，眼动追踪技术主要应用于医学和心理学领域，但是近年来，随着计算机和人机交互技术的发展，它也被越来越多地应用于人机交互中。

在人机交互中，眼动追踪技术可以起到很多的作用，例如改善用户体验（user experience）、提高交互效率、研究用户行为等等。

本文将主要从以下几个方面介绍眼动追踪技术在人机交互中的应用。

1. 人机界面的设计人机界面的设计是人机交互中最重要的任务之一，良好的界面设计可以提高用户的满意度和效率。

利用眼动追踪技术，可以对用户进行实时反馈，以便更好地理解用户对不同部分的交互功能的需求。

在界面设计阶段，眼动追踪技术可以帮助设计师分析用户实际使用界面时的行为和反应，以及设计者预测用户在进行各种交互任务时的行为。

这样就可以通过改进交互策略来提高人机交互体验，减少用户的工作负担。

2. 用户体验用户体验的改善是人机交互领域的一个重要目标，而眼动追踪技术可以帮助设计人员定位用户在界面上的注意点，进而更好地了解用户行为和行为的动机。

在人机交互中，眼动追踪技术可以在不干扰用户的情况下，精确地记录用户在屏幕上的注意力分布，这有助于开发者更好地了解用户对交互设计的反应、用户体验的功效和潜在的缺陷。

3. 界面操作眼动追踪技术在人机交互中的应用范围非常广泛。

在人机交互过程中，我们也可以利用它来操作界面。

比如，用户可以通过看向某个控件的方式来触发它的响应，实现更加自然和高效的交互。

4. 数据分析人机交互的有效性直接决定着系统功能的实用性，同时，数据收集和分析也是人机交互中关键的步骤之一。

眼动追踪技术可以收集大量的用户交互行为数据，这些数据可以用于了解用户交互行为的模式，并通过分析数据来改善交互设计。

总之，眼动追踪技术在人机交互中的应用是一个不断拓展和丰富的领域，它可以深入用户的眼睛，全面了解和调查用户的行为模式，提供更好的交互和 UX 体验。

眼动追踪技术在人机交互中的应用

眼动追踪技术在人机交互中的应用1.引言：眼动追踪技术的定义和背景眼动追踪技术是一种常用于研究人类视觉处理的技术，能够通过追踪眼部运动轨迹来研究人眼对视觉刺激的反应和处理过程。

目前，随着计算机技术和交互设计的不断发展，眼动追踪技术也被广泛应用于人机交互领域，成为改善用户体验、提升交互效率的重要工具。

2.眼动追踪技术在用户测试中的应用2.1.眼动追踪技术在用户测试中的基本原理在用户测试中，眼动追踪技术可以通过追踪用户的眼部运动轨迹，获取用户对界面元素的注意力分配、信息处理方式、对话框使用偏好等行为数据。

通过分析这些数据，可以了解用户在使用界面时的注意力集中度、信息处理的时间和方式、界面布局设计是否合理等方面的信息。

2.2.眼动追踪技术在用户测试中的应用场景在用户测试中，眼动追踪技术主要应用于以下几个场景：（1）界面布局设计：通过追踪用户的眼动轨迹，了解用户的视觉焦点，优化界面布局设计，使用户更容易理解信息，并提升使用效率。

（2）信息可读性评估：通过追踪用户对文本、图像等信息的注视时间和位置，评估信息是否易于阅读和理解，从而提出改善意见。

（3）对话框优化：通过追踪用户在对话框中的操作轨迹和注视位置，评估对话框的易用性，提出改善意见，保证用户能够轻松完成复杂操作。

3.眼动追踪技术在交互设计中的应用3.1.眼动追踪技术在交互设计中的基本原理在交互设计中，眼动追踪技术可以通过追踪用户的眼部运动轨迹，了解用户的交互行为和操作意图，帮助设计师优化交互设计，提升交互效率和体验。

3.2.眼动追踪技术在交互设计中的应用场景在交互设计中，眼动追踪技术主要应用于以下几个场景：（1）探索行为设计：通过追踪用户的眼动轨迹，了解用户在探索应用界面时的注意力分配和信息处理方式，从而了解用户对应用的理解和掌握程度，为优化应用提供依据。

（2）交互行为设计：通过追踪用户在交互过程中的眼动轨迹，了解用户交互行为和操作意图，优化交互设计，提升操作效率和体验。

人机交互知识：人机交互中的视线追踪和头部姿势识别

人机交互知识：人机交互中的视线追踪和头部姿势识别随着人机交互技术的不断发展，越来越多的技术被应用到我们的日常生活中。

其中，视线追踪和头部姿势识别技术的应用越来越广泛，为我们的交互体验提供了更加丰富多彩的方式。

本文将重点介绍这两种技术的原理、应用以及未来发展趋势。

一、视线追踪技术1.原理视线追踪技术是一种可以跟踪用户眼睛运动的技术，通过摄像头、红外线等设备获取用户的眼球位置信息，可以确定用户正在看向哪个区域或物体，以此为基础实现交互。

视线追踪技术主要有以下几种方法：（1）电极式：通过在用户眼部或头部上安装电极，采集电信号来确定眼睛位置。

（2）红外线式：使用单个或多个摄像头来获取用户眼部区域的红外线信息，从而计算出眼球的位置。

（3）瞳孔跟踪法：通过镜头观察瞳孔反射的光源位置，通过几何原理计算出眼球位置。

2.应用视线追踪技术在游戏、广告、医疗等领域有着广泛应用。

在游戏中，通过视线追踪技术可以实现目光控制游戏，让用户更加沉浸其中。

在广告行业中，可以通过分析用户眼睛的注视点来确定哪些元素更加吸引眼球，并根据这些信息制作更加有效的广告。

在医疗领域，视线追踪技术可以帮助研究人类视觉系统的工作方式，并研究视觉障碍等问题。

二、头部姿势识别技术1.原理头部姿势识别技术通过摄像头、红外线等设备实时获取用户头部的姿势信息，如头部的旋转、俯仰、倾斜等，以此为基础进行交互。

头部姿势识别技术主要有以下几种方法：（1）基于RGBD相机：利用深度相机捕捉用户头部3D模型的形态操作，进行空间位置的检测。

（2）基于红外线：利用红外线摄像机扫描用户的面部信息，从而获取用户头部的旋转、俯仰等信息。

（3）基于机械惯性：使用MEMS陀螺仪等机械设备捕捉用户头部姿势变化。

2.应用头部姿势识别技术在游戏、影音娱乐等领域有着广泛应用。

在游戏中，利用头部姿势识别技术可以实现用户头部的旋转、俯仰等操作，让用户在游戏中更加身临其境。

在影音娱乐领域中，可以通过头部姿势识别技术实现3D场景重构、视频播放控制等等。

基于视线跟踪技术的人机交互系统设计与实现

摘要视线跟踪技术是计算机视觉领域的热门课题，基于视线跟踪技术的人机交互方式是目前多通道自然交互领域中备受关注的研究方向。

将视觉跟踪技术应用于人机交互，可以改善传统人机交互模式，给用户带来全新、自然和高效的交互体验，此外还可以帮助上肢行动障碍人士像正常人一样平等、自然地与计算机进行交流，因此课题具有一定的学术价值和社会意义。

论文研究了典型的视线跟踪技术，并在此基础上结合立体视觉技术设计了一款基于视线跟踪技术的人机交互系统。

系统硬件设计主要工作有：设计图像采集模块实现对用户面部图像的获取；设计光标控制模块实现与计算机的交互；设计图像显示模块完成视频图像地实时显示；利用SoC技术将ARM硬核处理器、图像采集模块、图像显示模块和光标控制模块进行集成完成系统的整体硬件设计。

系统的嵌入式软件设计主要工作有：在平台上移植嵌入式Linux操作系统实现多任务处理；移植Qt图形库设计开发显示界面；移植OpenCV计算机视觉库帮助实现部分图像处理算法；开发上层应用程序，检测与视线方向相关的特征，计算用户头部姿态，完成对用户视线注视点的定位，最后对计算机光标进行相应控制，实现人机交互功能。

论文的主要的贡献有：①提出以立体视觉技术计算人脸朝向的视线跟踪方法，此方法允许用户头部在一定范围内运动，并对用户视线进行准确跟踪；②针对自然光照下低分辨率人眼图像虹膜定位困难的问题设计了圆算子结合边界法的虹膜定位算法；③利用SoC技术进行嵌入式产品的原型开发，增强了可扩展性，便于后续的功能升级和快速产品化。

经测试验证，在用户看显示器的过程中，系统能对用户的视线进行跟踪，且可以根据跟踪结果对计算机光标进行相应控制，通过视线实现人机交互的功能。

关键词：人机交互，视线跟踪，SoC，立体视觉，嵌入式开发ABSTRACTThe gaze tracking technology is a hot topic in the field of computer vision and the human-computer interaction based on gaze tracking technology has been attracting more and more researchers' interest in the field of multi-channel natural interaction. The appli-cation of gaze tracking technology for human-computer interaction can change the tradi-tional human-computer interaction mode, which can bring new, natural and efficient in-teractive experience to users and help the physically disabled people communicate with computers naturally as normal. so the subject has a certain academic value and social significance.This thesis studies typical gaze tracking technology, and designs gaze tracking tech-nology based human-computer interaction system combined with stereo vision technol-ogy. The main work of hardware design includes the following aspects. Designing of the image acquisition module to capture the user's face image. Designing of the cursor control module to interacte with the computer. Designing image output module to complete the real-time video image display. By using the SoC technology, it integrats the ARM hard-core processor, image acquisition module, the image output module and the cursor control module and finally implements the overall hardware design. The software design of em-bedded system implements as following aspects. Transplanting embedded Linux operat-ing system on the platform to achieve multi-tasking. Transplanting Qt graphics library to design display interface. Transplanting OpenCV computer vision library to help achiev-ing part of the image processing algorithms. Developing the upper application, detecting the characteristics related to the direction of the gaze, calculating the user's face orienta-tion, completing the positioning of the user's gaze, and finally controlling the computer cursor to achieve human-computer interaction.The contributions of this thesis are as follows. First the method of gaze tracking through calculating the face orientation with stereo vision is proposed, which allows the user's head move within a certain range and tracks the user's gaze accurately. Second the Iris localization algorithm based on circle operator and boundary method is designed for solving the problem of iris location in low-resolution human eye image under natural light. Last using the SoC technology can enhance the scalability and benefit the following func-tion upgrade and rapid commercialization.The test results show that the system can achieve the gaze tracking when user viewthe monitor, and can control computer's cursor based on the gaze tracking results corre-spondingly, at last can achieve human-computer interaction through the line of sight.Keywords: Human Computer Interaction, Gaze Tracking, SoC, Stereo Vision, Embedded Development目录目录中文摘要 (I)英文摘要....................................................................................................................... I II 1绪论 .. (1)1.1研究背景及目的 (1)1.2国内外研究现状 (2)1.3论文的主要工作及章节安排 (4)2 系统总体方案设计 (7)2.1需求分析 (7)2.2设计要求 (8)2.3系统总体方案设计 (8)2.3.1硬件设计方案 (9)2.3.2系统软件设计方案 (10)2.4本章小结 (11)3 系统硬件设计 (13)3.1SoC架构开发流程 (13)3.2HPS核心处理模块设计 (15)3.3图像采集模块设计 (18)3.4光标控制模块设计 (19)3.5图像显示模块设计 (22)3.6本章小结 (26)4 系统软件设计 (27)4.1软件开发环境搭建 (27)4.1.1定制Linux操作系统 (27)4.1.2搭建Qt开发环境 (29)4.1.3移植OpenCV图像处理库 (30)4.2双目立体视觉系统标定 (32)4.3图像采集 (35)4.4图像处理 (37)4.4.1人脸检测 (37)4.4.2眼睛和嘴巴粗定位 (39)4.4.3虹膜定位 (40)4.4.4内眼角点定位 (42)4.4.5睁眼闭眼检测 (44)4.5注视点检测定位 (45)4.5.1头部姿态估计 (45)4.5.2注视点定位 (47)4.6USB芯片固件程序开发 (50)4.7图像显示设计 (53)4.8本章小结 (54)5 系统测试及结果分析 (55)5.1系统实物 (55)5.2测试方案 (55)5.3测试环境 (56)5.4系统功能测试 (56)5.5系统性能测试 (58)5.6本章小结 (63)6 总结与展望 (65)6.1课题工作总结 (65)6.2下一步研究方向 (65)致谢 (67)参考文献 (69)附录 (73)A.作者在攻读硕士学位期间参与的科研项目 (73)B.作者在攻读硕士学位期间竞赛获奖情况 (73)1 绪论1绪论随着人机交互的发展，视线跟踪技术得到广泛的关注和研究，本章节简要介绍视线跟踪技术的发展历程以及目前视线跟踪技术存在的问题，针对这些问题提出了本文的研究内容，并对本论文的章节做出安排。

眼动追踪技术在人机交互中的应用研究

眼动追踪技术在人机交互中的应用研究随着技术的不断发展，人机交互变得越来越普遍，而眼动追踪技术作为一种新兴的人机交互方式，其优点逐渐得到了广泛的认可。

眼动追踪技术是将眼球运动作为输入信号，用电子设备采集、处理和分析这些信号，从而实现人机交互的一种方式。

一、眼动追踪技术的原理眼动追踪技术是通过研究人类视觉系统的结构来实现的，其中重要的一个结构是视网膜。

视网膜是人眼中最重要的视觉处理单元，它能够感受到外界环境中的光线，并将其转化为电信号，这些电信号将被传递到视觉传感器的后端。

眼动追踪技术利用这些电信号来跟踪人眼的位置和运动，从而实现人机交互的效果。

二、眼动追踪技术的应用1. 科学研究领域眼动追踪技术在科学研究领域中发挥着重要的作用。

在认知心理学领域中，研究者利用眼动追踪技术来探究人类的视觉处理机制，比如，人类如何处理复杂的视觉信息。

此外，在医学研究领域中，眼动追踪技术被广泛应用于神经系统疾病的诊断和治疗，如失明、老人痴呆等。

2. 优化用户体验在人机交互领域中，眼动追踪技术被应用于优化用户体验。

比如，在游戏开发中，游戏开发者可以利用眼动追踪技术来实现更加直观、自然的操控方式，提高游戏的游戏性。

另外，在网页设计中，设计者可以利用眼动追踪技术来优化网页的布局和设计，从而提高用户体验。

3. 眼动追踪技术在卫生领域的应用眼动追踪技术在卫生领域中也发挥着重要的作用。

比如，在康复领域中，眼动追踪技术被用来帮助恢复神经系统功能，帮助患者恢复生活自理能力。

此外，眼动追踪技术还在诊断和监测眼部疾病方面得到了广泛的应用。

三、眼动追踪技术的优势与传统的人机交互方式相比，眼动追踪技术具有很多的优势。

首先，眼动追踪技术是一种更加直观、自然的人机交互方式，因为人类的视觉系统本身就是用来接收和处理视觉信息的，而不需要通过键盘或者鼠标来进行操作。

其次，眼动追踪技术具有高度的准确性和稳定性，可以精确地跟踪人眼的位置和运动，从而提高人机交互的精度和效率。

基于视线追踪的增强现实人机交互方法

2.1. 基于外观的方法
基于外观的方法与眼睛的实际几何特征无关，这种方法通过眼睛区域的光度特性进行检测保留眼睛图像像素的空间和强度信息。依赖于直接建立在眼睛区域外观上的模型，在概念上涉及通过构建图像块模型，通过使用相似性度量的模型匹配来执行眼睛检测来进行模板匹配[7]。基于外观的方法可以进一步分为基于强度和子空间的方法。基于强度的方法直接使用强度或滤波强度图像作为模型，而子空间方法假设眼睛图像的重要信息在较低维度子空间中定义。
DOI: 10.12677/csa.2019.95115
1022
计算机科学与应用
陈卫兴等
突出边缘特征，以便于网络的学习，同时调节图像尺寸为 256 × 256 像素值。
3.2. 异构嵌套神经网络
步骤一：输入图像先经过一层 Batch Normalization(BN)层，一层 7 × 7 卷积核的卷积(CONV)层，一层修正线形单元(relu)层，再进入由 4 个模块组成的卷积网络中。每个模块都由若干个小网络组成，除了第一个模块的第一个网络外，其余网络的输入皆为上个模块的输出与输入的和。
视线追踪技术的不断改善在于提高准确率和帧率的同时降低侵入性和减少数据带宽，从而优化设备的穿戴体验和交互体验。移动技术的发展使视线追踪从桌面端的研究和应用转移到移动端，从而发展普适的视线追踪方法，将视线追踪用于 OST-HMD 的交互，可以弥补手势识别和语音识别的不足。一方面，佩戴在人眼前的增强现实眼镜与眼动交互具有很高的契合度，通过视线追踪进行交互也将大大提高自由度；另一方面，在手势和语音的操作受到限制的情况下，譬如在一些特殊的应用场景：医生在为病人做手术时，通过眼睛控制 OST-HMD 的手术导航系统来完成更多必要的操作。此外，视线追踪可以帮助佩戴增强现实眼镜的残障人士(渐冻症患者只有眼球可以运动)完成一些必要的操作，作为提高生活质量的媒介。近几年随着硬件计算能力的提高，增强现实眼镜以及头戴式增强现实设备体积在逐步缩小，增强现实有望成为未来通用的计算平台。眼镜的后置相机捕捉用户视线位置，前置相机捕捉注视环境，进而得到用户在环境中的注视点。用户可以通过佩戴增强现实眼镜进行操作来即时获取所需要的信息，跳过了用户手动查找信息这一步骤，将使人们的工作和生活效率发生质的变化。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

陈卫兴等
接层得到一个眼睛的55个特征点，在此基础上分别得出视线向量和瞳孔中心，进而得到了用户视线。在近眼部位采用两个非红外光源相机分别追踪双眼的运动，角膜中心误差降到了0.66 mm，角度误差降到了0.89˚。最后本文在HNN中做了不同通道数的对比以及HNN和Resnet网络的对比。实验结果表明，相比于传统方法和普通的卷积神经网络，本文提出的HNN网络对眼睛追踪效果有明显提升。
摘要
本文结合现有光学透视头戴显示设备，提出了基于视线进行交互的方法。受到Resnet网络思想的启发，提出了一种异构嵌套的卷积神经网络(Heterogeneous nested neural, HNN)，通过12层卷积和3层全连
*通讯作者。
文章引用: 陈卫兴, 纪欣伯, 崔笑宇. 基于视线追踪的增强现实人机交互方法[J]. 计算机科学与应用, 2019, 9(5): 1020-1028. DOI: 10.12677/csa.2019.95115
本文提出视线追踪方案是通过异构嵌套的神经网络模型解决了上述两个缺点，用普通近焦相机在眼前 2 cm 的位置拍照，避免了头部运动的干扰的同时，减少了眼部区域的外部图像参数的评定，无需在进行标定，可以直接进行追踪。本文的方法结合了深度学习与神经网络，取得了较好的效果，为增强现实系统的眼动交互奠定了基础。
视线追踪技术的不断改善在于提高准确率和帧率的同时降低侵入性和减少数据带宽，从而优化设备的穿戴体验和交互体验。移动技术的发展使视线追踪从桌面端的研究和应用转移到移动端，从而发展普适的视线追踪方法，将视线追踪用于 OST-HMD 的交互，可以弥补手势识别和语音识别的不足。一方面，佩戴在人眼前的增强现实眼镜与眼动交互具有很高的契合度，通过视线追踪进行交互也将大大提高自由度；另一方面，在手势和语音的操作受到限制的情况下，譬如在一些特殊的应用场景：医生在为病人做手术时，通过眼睛控制 OST-HMD 的手术导航系统来完成更多必要的操作。此外，视线追踪可以帮助佩戴增强现实眼镜的残障人士(渐冻症患者只有眼球可以运动)完成一些必要的操作，作为提高生活质量的媒介。近几年随着硬件计算能力的提高，增强现实眼镜以及头戴式增强现实设备体积在逐步缩小，增强现实有望成为未来通用的计算平台。眼镜的后置相机捕捉用户视线位置，前置相机捕捉注视环境，进而得到用户在环境中的注视点。用户可以通过佩戴增强现实眼镜进行操作来即时获取所需要的信息，跳过了用户手动查找信息这一步骤，将使人们的工作和生活效率发生质的变化。
2.3. 基于深度学习的方法
近年来深度学习与神经网络的发展得较为迅速，以卷积神经网络为代表的面向图像的深度学习算法得到了广泛的应用和优化。因此，基于深度学习的视线追踪方法开始受到人们的关注。台湾大学的 Chih-Fan Hsu 等人[10]通过 CNN 对眼动视频进行了分析和研究，剑桥大学 Erroll Wood 等人[11]开发的 UnityEyes 为训练神经网络提供了完备的数据集。
Keywords
Eye Tracking, Deep Learning, Augmented Reality
基于视线追踪的增强现实人机交互方法
陈卫兴，纪欣伯，崔笑宇*
东北大学，中荷生物医学与信息工程学院，辽宁沈阳
收稿日期：2019年5月11日；录用日期：2019年5月24日；发布日期：2019年5月31日
Open Access
1. 引言
增强现实是一项将虚拟与现实相结合的技术，它可以应用于医疗、生产生活、工业设计和娱乐等各个行业[1]。随着计算能力的提高和 5G 技术的发展，增强现实有望成为未来通用的计算平台。光学透视头戴式显示器(Optical See Through-Head Mounted Display，OST-HMD)作为增强现实系统的主要载体，近几年国内外发布的面向消费者的产品日益增多[2]，在扩大普及度的同时，如何在 OST-HMD 上更好地进行人机交互成为目前增强现实领域需要解决的问题。目前增强现实的人机交互(Human-Computer Interaction，HCI)在手势和语音构建得较为完善，微软在 2016 年推出的 HoloLens 已经支持了语音交互和手势识别[3]，同年德国的 pupil labs 开发出可装置在 HoloLens 上的眼追踪相机。2018 年 magic leap 公司发布的混合现实(MR)头显在眼镜内测装置了眼追踪摄像头，但交互方式仍以手势操作和手柄控制为主。
Computer Science and Application 计算机科学与应用, 2019, 9(5), 1020-1028 Published Online May 2019 in Hans. /journal/csa https:///10.12677/csa.2019.95115
2.1. 基于外观的方法
基于外观的方法与眼睛的实际几何特征无关，这种方法通过眼睛区域的光度特性进行检测保留眼睛图像像素的空间和强度信息。依赖于直接建立在眼睛区域外观上的模型，在概念上涉及通过构建图像块模型，通过使用相似性度量的模型匹配来执行眼睛检测来进行模板匹Байду номын сангаас[7]。基于外观的方法可以进一步分为基于强度和子空间的方法。基于强度的方法直接使用强度或滤波强度图像作为模型，而子空间方法假设眼睛图像的重要信息在较低维度子空间中定义。
3.1. 图像预处理
训练前首先进行图像的预处理，两个普通光学相机分别采集左右眼部的原始红绿蓝三通道图像，对
图像中的红色通道进行直方图均衡化，增强大多数场景下的图像细节。再在 RGB 空间利用公变换式
g ( I, j) = a × f ( I, j) + b
(1)
式(1)中 a > 1 时图像对比度增强，从而突出皮肤与眼球以及眼白与虹膜的色彩差别。最后经过锐化处理，
2. 研究背景
视线追踪的方法可分为侵入式和非侵入式，最早的眼追踪是用巩膜搜索线圈嵌入到眼部区域[4]这种
DOI: 10.12677/csa.2019.95115
1021
计算机科学与应用
陈卫兴等
方法具有高侵入性，对使用者的干扰较大。在过去的几十年中，随着图像处理算法的发展和计算能力的提高，非侵入式的视线追踪在注释分析、情感分析、认知研究等领域和固定于桌面系统的视线追踪方法已经取得了一系列的成果[5]。基于数字视频分析的视线追踪(Video Oculographic, VOG) [5]，仅通过摄像机追踪视线的变化逐渐成为非侵入式的热点研究方法，此后衍生出一系列眼球追踪的图像学方法。其中，使用瞳孔跟踪或角膜反射跟踪(PCCR)已被广泛应用，而扭转分量的测量通常被认为是计算上更为困难的任务，解决该问题的方法包括极坐标互相关方法和虹膜的匹配和跟踪[6]。典型非侵入式的视线追踪包括基于外观的方法和基于形状的方法[5]，以及近些年受到关注的基于深度学习的方法。
3. 基于异构嵌套神经网络的视线交互
本文提出了一个异构嵌套的卷积神经网络模型(HNN)。该网络采用 Resnet 网络的思想，基于 tensorflow 1.8 的 GPU 版本进行构建，网络的详细结构如 3.2 所述。数据集来源上文提到的 UnityEyes，根据相机位置和角度调节生成器的参数，共生成 70,000 张眼睛图片。
DOI: 10.12677/csa.2019.95115
1022
计算机科学与应用
陈卫兴等
突出边缘特征，以便于网络的学习，同时调节图像尺寸为 256 × 256 像素值。
3.2. 异构嵌套神经网络
步骤一：输入图像先经过一层 Batch Normalization(BN)层，一层 7 × 7 卷积核的卷积(CONV)层，一层修正线形单元(relu)层，再进入由 4 个模块组成的卷积网络中。每个模块都由若干个小网络组成，除了第一个模块的第一个网络外，其余网络的输入皆为上个模块的输出与输入的和。
关键词
视线追踪，深度学习，增强现实
Copyright © 2019 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). /licenses/by/4.0/
Eye Tracking Based Augmented Reality Human-Computer Interaction Method
Weixing Chen, Xinbo Ji, Xiaoyu Cui*
Sino-Dutch Biomedical and Information Engineering School, Northeastern University, Shenyang Liaoning
Received: May 11th, 2019; accepted: May 24th, 2019; published: May 31st, 2019
Abstract
In order to improve the human-computer interaction (HCI) of augmented reality, we combined with the existing optical see-through head-mounted display (OST-HMD). Inspired by the Resnet network idea, we proposed a Heterogeneous nested neural network, which outputs 55 feature points of an eye. On this basis, we respectively get the line of sight vector and the center of the pupil. Two Non-IR cameras are used to track the movement of both eyes in the near eye area. The corneal center error was reduced to 0.66 mm and the angular error was reduced to 0.89˚. The method has achieved good results, which lays a foundation for the eye movement interaction of the augmented reality system.