《国际刑警2019-2022年文件检验回顾》简译【上篇】
《国际刑警2019-2022年文件检验回顾》一文刊登于期刊《国际法庭科学:协同》,是作者玛丽·德维特纳-拉佩尔(就职于法国国家宪兵队刑事研究所 (IRCGN))、萨米亚·易卜拉欣(就职于加拿大边境服务局 (CBSA))对自2019年第19届国际刑警组织国际法庭科学管理研讨会举办以来,文件检验领域的技术进展和整体研究领域进行的全面回顾。
该综述基于在2019年至2022年中这段时间发表于国际范围主要的法庭科学相关技术杂志、书籍,以及国际法庭科学专业会议上的演讲和相关介绍,以供各位读者参考。文中的参考资料来源丰富,涉及21本教科书、450篇已出版的论文和543份被收录的会议稿(含研讨会),也包括仅在网络上公开的文章和会议稿。其中不乏中国文检专家的相关研究。
文章作者也明确表示,已尽力使此篇回顾涵盖了法庭科学技术领域中笔迹/文件检验的所有进展,但仍可能存在一些遗漏。另外需要强调的是,所有论文和演讲稿的科学基础均未经验证。
由于各论述的原文内容非常丰富,篇幅较长,为节约读者的时间,文章作者将其中涉及笔迹、书写工具和墨水、印刷技术、邮票和邮票墨水、介质/基材、文件日期、文件恢复(细分为改动和销毁、烧焦和液体浸泡、重建)、数字文档和安全文件测试的主要概述在本文中罗列。质量保证部分还包含子类别:人为因素和认知偏差,有效性验证和法院示证,以及标准和最佳实施方案。
本篇主要介绍笔迹检验技术在这些年的发展,特别是包括不少中国相关文检专家发表的论文。近年来,国内关于笔迹量化检验技术也在飞速发展,涌现出针对笔迹特征进行精确测量的产品,实现以量化数据为笔迹检验进行赋能,从而进一步提升笔迹检验的科学性和法庭示证效率。
原文中的注释部分约5万字,受系统篇幅限制无法同时上传。如有需要,请点击链接下载(文件大小约20MB)。
更多其他方面内容以系列后续文章(中篇/下篇)的方式进行呈现。
欢迎用户单位与我们接洽,了解笔迹检验相关设备和技术发展。
笔迹检验
本节分为四个内容:线下检验、电子签名、自动化系统和凹痕检验。“线下”是用于描述手写和在传统意义上签名动作的术语,即使用墨水(或其它书写工具)在纸(或其他基材)上书写。电子签名在过去几年中呈爆炸式增长,值得在本次评论中单独讨论。自动化系统虽然并不新颖,但在本次评论中占有一席之地,因为该主题与取证相关。最后,书写的凹痕形成特包含在笔迹检查的本节中,因为凹痕形成能够揭示了书写压痕和运笔的信息。
1、线下检验
本小节重点介绍了审查期间出版的两本教科书,以及出版的72篇有关笔迹识别和检查的文章,其中包括笔迹教育研究,为文检人员提供了重要的内容和背景。此外,在此期间的各种法庭科学专业会议上也进行了51场涉及文件检验技术的演讲。
在编写本回顾期间出版了两本专门针对笔迹检验的教科书。穆罕默德编写了《签名法庭科学检验》,这是一部综合性著作,解释了签名生成的神经科学和运动学,并给出了有关该主题的研究的具体细节。它为法医检查人员在检查签名时提供实用的细节参考,特别是在这个数字签名使用频率不断增加的时代。该参考资料由一位最重要的法证文件审查员撰写,为法证笔迹审查员、法律界、司法部门和学术界提供了签名检查最新状况的全面记录,以及解决未来研究以提高可靠性的计划领域的[1]。
莫里斯写了一篇关于笔迹识别的基本概念和原理的现代文本[2]。本文面向执法部门和法律界,教授如何解读审查员报告、各种笔迹意见的意义以及必须考虑的影响因素。
1.1 笔迹检验
谭等人对巴生谷华人社区的中文汉字和拉丁文字手写系统之间的跨语言关系进行了调查[3]。他们的研究表明,使用两种不同语言系统时,个人的笔迹存在一些对应关系。
Negrini Neto等人提出了一种测量笔迹笔压的新方法。描述了通过由预选择器光学分析仪组成的系统对手写文档进行分析,该系统配备有不同波长的光源、带通滤波器以及光学相干断层扫描仪。作者声称,通过这种与基质无关的方法,可以识别正在调查的证据之间的相似性或差异,从而增加正确归属书写者身份的可能性[4]。
郭和李对握笔位置对笔压的影响进行了初步研究。他们收集了几个汉字的笔迹样本,并利用笔划压痕的3D特性来探索留在纸上的笔划如何协助法医调查[5]。作者发现,他们可以非常确定地判断样本是用左手还是右手书写的,以及如何握笔。
郭和贾在他们的研究项目中[6]试图通过研究伪造者的技术描述并结合眼动跟踪研究来检测伪造品并识别伪造者。研究的第一步表明,通过使用事件相关电位技术,伪造者在识别自己的赝品时比识别真实的样本更困难。研究假设是,模仿者面临更多困难,因为伪造品不仅包括他们有意识复制的特征,还包括他们在尝试伪造过程中无法成功抑制的一些自己的笔迹特征。
Bennour等人通过识别笔迹中的关键点并将这些关键点周围的补丁进行聚类来生成隐式形状密码本,用以形容书写者特质并报告了良好的识别成功率[7]。
Fuglsby等人在他们的研究中[8]研究了两种自动手写识别系统之间的关系。第一个系统使用从手写静态图像中提取的测量值,而另一个系统则使用笔划的运动学特征,计算每个系统的样本对之间的差异。结果表明,运动空间几何笔划特征和基于图形的特征以及时间特征存在关系,但笔压力不存在关系。
康等人[9]研究了专业文检人员组和非专家组进行的韩语笔迹检查的错误率。正如预期的那样,错误率对于专业文检人员组来说不如非专家组那么重要。然而,专业文检人员给出的更多是“不确定的意见”,当笔迹样本被摹仿或者伪装时,错误率更为重要。研究的另一部分表明,同行评审对于降低错误率很重要。该研究还表明,经济奖励会影响非专家组的结果。
Marcinowski[10]创建了一种新颖的顶级可解释神经网络(TINN),用于识别手写文档的书写者。提取的特征包括80个笔迹二元特征和4个笔迹二元类别。结果表明,TINN模型在书写者识别方面优于所有测试的比较模型,但在特征提取方面劣于其他比较模型。
笔迹变化是法庭科学检验期间评估的一个关键特征。托马斯等人对十年内的真实笔迹变化进行了初步研究[11]。结果表明,一旦成年人掌握了特定的书写模式,每个字母的主要模式以及类别和个人特征都保持不变,但字母的大小可能会随着年龄的增长而变化。
来自中国的一项研究讨论了男性和女性在书写的神经基础上存在的差异。杨等人在一项抄写任务中使用功能磁共振成像(fMRI)来检查53名健康成年人笔迹性别差异的神经基础,强调了在涉及笔迹的科学研究和临床应用中考虑性别因素的重要性[12]。
高和王对听写笔迹样本进行了探索性分析,包括听写样本的定义、与实验样本的关系、实际问题、可行的采集方法以及需要特别注意的一些关键点[13]。
一篇关于签名多学科研究的文章着手确定对文件进行全面笔迹和技术研究的必要性,以进行客观、全面和完整的研究,并为检验前提出的问题提供合理和正确的结论[14]。2020年,该小组发表了一篇关于短的简单签名研究的文章[15]。此外,关于签名检查的主题,Drobysheva等人分析了理论方面,并对在相当长的时间间隔内执行的签名检查进行了文献综述[16]。作者在研究这些特征时提出了现代方法论。
Cherpenko描述了复印件笔迹检验中的典型错误[17]。该文举例说明了专家报告中最常见的错误,包括对ENFSI专家结论的内部和外部同行评审的评论。为了避免文中描述的大多数错误,作者建议遵循相关方法论参考,密切关注检查对象的质量,并严格遵守所有中间阶段的检查方法。
关于一个笔迹检验专家的工作和科学创造性的回顾,Valeria Fedorovna Orlova教授(1926年1月18日–2021年3月18日)[18]。作者介绍了Orlova教授的主要理论著作和方法论,并介绍了俄罗斯法医笔迹检验的主要工作和能力。
Kutskir撰写了有关当前伪造的方法[19]。Sharma等人借助特定的个人书写特征来考虑伪装书写:起笔、笔画连接特征和单个字母的形成[20]。另一项研究[21]出于书写者身份识别的目的,探讨了个人完整签名和简单签名之间的相似性。而拉尼等人的团队[22]对用不习惯的手写的伪装笔迹的书写者身份进行了初步研究。
在对多代影印笔迹中出现的线条质量特征进行检验的研究中,Jasuja等人试图研究和评估复制过程对几种线路质量特征的影响[23]。作者测试了五代复印机复制品,对9个不同品牌和型号的复印机的100个原始签名样本生成了4500个复制品。评估诸如字母或字符的首笔和结尾笔画、书写工具的特殊特征(例如:粘稠、条纹痕迹)以及与书写者相关的特征,如提笔、颤抖、润饰、引导线、运动脉冲等特征。另一项研究涉及复印版本中签名失真的研究[24],特别是五个不同的后续版本的复印过程对各种特征的影响,例如线条质量、笔抬起和颤抖、书写工具特性(例如:墨水粘稠)、以及打印机的功能(例如:线条加粗)。在这项研究中,使用不同类型、不同品牌的笔在官方常用的各种类型的纸质基材上采集了不同个人的2550个真实签名样本。
韦尔奇进行了一项利手习惯调查,试图向社会提供有关不同文化和跨历史时间尺度的人类利手习惯的信息[25]。
Ridolfi[26]描述了受训者制定自己的区分笔迹标准的练习结果特征,应用统计方法来关联特征,然后制定一个方案来描述这些特征,使受训者能够评估相似作品之间的一致程度。通过使用涉及字母形状、倾斜度、高度比等的分类系统,受训者可以根据每个特征将这组文字细分大约一半,以获得与给定模型最接近的匹配。
Lister进行了研究,以证明新手是否能够识别已知样本中每个人笔迹的书写特征,并在未知样本中找到这些特征,无论是自然的笔迹还是伪装的笔迹[27]。从六个人身上收集了五份笔迹样本,其中每人一份参考样本、三份自然未知样本和一份伪装样本。新手对每个收集的样本进行分析,并将参考样本与未知和伪装样本进行比较,以正确识别未知和伪装样本。新手在正确识别天然样本方面表现出很高的准确性,但在分析伪装样本时却得出了错误的结论。这项研究表明,该学科的一些知识可以最大限度地减少误导性结论,这可以应用于法医文件审查员,并与非审查员的分析进行比较。研究还表明,单一特征不足以使笔迹样本个性化,需要多个相似的特征才能形成比赛的明确结论。
马奎斯等人的论文[28]探讨了在评估问题签名比较时如何考虑伪装的可能性。在这个工作案例中,真正的书写者可能掩盖了有问题的签名。论文提出了在评估签名比较时逻辑上考虑伪装的选项。
王先生关于中文笔迹鉴定现状和方法论改进的文章描述了对笔迹的影响并阐述了鉴定方法[29]。探索了定义笔迹特征的方法,以及特征的数量及其个性化程度。作者提供了实际案例来支持所提出的理论。
Miton和Morin在他们关于书写系统中的图形复杂性的文章[30]中回答了有关书面字符的视觉复杂性和书写演变的三个核心问题:(1)什么决定了字符复杂性?(2)我们能否在字符复杂性上找到进化变化的痕迹?(3)复杂性的分布方式是否使字符识别更容易?他们提出的研究结果需要进行更详细的调查。
Tripathy等人发表了对在不寻常表面上发现的文字进行笔迹检查的评论。涵盖法医调查、其结果和此类分析的成功率,包括在非常规和不寻常的表面上书写的不同书写工具[31]。
潘迪等人[32]通过对举重运动员与没有进行举重训练的人的笔迹变化进行比较研究,探讨了“动作越高,技能越高”的假设。为了进行分析,从两组中抽取笔迹样本并进行分析,结果表明举重运动员与非举重运动员的笔迹变化存在显着差异。作者推测这是由于肌肉僵硬导致书写时身体运动较少。
1.2 笔迹教育
已经发表的大量关于笔迹检验的指导,这对文检人员理解——特别是在这个全球化的世界中——许多国家不再遵守标准的笔迹相关标准和培训非常重要。一项研究旨在全面了解单词级别的拼写、手写速度和手写质量之间的发展和纵向关系[33]。另一项研究[34]旨在确定波斯语笔迹评估工具(PHAT)在小学学龄儿童中的进一步验证,结果表明该工具既有效又可靠。
渡边等人的一项研究[35]旨在阐明笔迹的发展过程并开发一种评估笔迹技能的新方法。他们报告发现,平均笔压一直增加到七岁,然后几乎维持在与成人相同的水平。他们发现与间距和大小参数以及整体手写技能之间存在类似的关系,但是手写执行所需的时间直到七岁为止都会增加,随后随着年龄的增长而减少。研究表明,在书写技能的发展过程中,早期是准确性的发展,其次是速度控制能力的发展。他们的方法也可能有助于评估和支持患有神经发育障碍的儿童,例如自闭症谱系障碍,这些儿童经常受到缺乏灵活性的影响。
塞梅拉罗等人调查小学一年级草书书写教学效果[36]。同样,罗萨里奥等人撰写了关于三种类型的书写干预对四年级学生书写质量的影响的文章[37]。中国大陆的一项研究[38]旨在开发一种工具来评估五六岁儿童的书写能力,并分析其信度和效度。乐等人提出通过结构方程模型对三年级儿童的运动技能和读写能力之间的关系进行建模,结果表明,在三年级,精细运动技能对读写能力的影响完全由执行功能和书写技能调节[39]。在香港,Tse等人使用中文姓名书写测试评估幼儿园儿童的早期书写技能[40]。
还有其他几篇关于世界各地的书写教学的文章。一项研究旨在通过对教师进行调查来调查台湾一到三年级的书写教学情况[41]。另一项调查对巴西教师群体的书写教学实践进行了调查,包括基于科学的研究(基于证据的实践)支持的教学实践的使用、对准备工作的看法以及书写教学中的自我效能感[42]。在智利,Banales等人调查了教师对如何教授书写的看法以及他们对教授这项技能的准备和有效性的信念[43],这项研究主要针对智利全国城市学校的四到六年级。在挪威,格雷厄姆等人对小学书写教学进行了一项全国调查,旨在调查书写教学方式以及这样做的准备和有效性[44]。同样在挪威,Skar等人研究了该国小学生的书写流畅度和书写质量[45]。
笔迹教学是教育学中一个充满活力的研究领域团体,其他几篇文章也被证明对法医团体有用。格雷厄姆等人对该领域的各种书写教育方法以及关注点进行了总结和回顾[46],而Park等人研究了教授儿童书写技能的触觉指导方法[47]。
Salameh-Matar等人发表了一项有助于第二语言笔迹检查的重要研究。本研究的重点是手写表现从希伯来语作为第二语言到阿拉伯语作为主要语言的迁移效应。样本由123名以阿拉伯语为母语的四年级学生组成,其中64名就读于单语学校,59名就读于双语(阿拉伯语-希伯来语)学校。评估了学生的阿拉伯语书写速度和可读性,以及他们的书写自动化、阅读表现、运动控制和非语言智力。结果显示,在控制阅读速度、手写自动化和运动控制后,单语学生在手写速度方面优于双语同龄人,但在易读性方面却不理想[48]。关于同一主题的另一项研究调查了手写技能从西里尔字母到拉丁字母的可迁移性。这项研究[49]能够利用哈萨克斯坦最近的政策变化,这为衡量这种转移以及练习西里尔字母的年数对拉丁字母手写质量的影响提供了机会。
冯等人的文章建议审查两种书写模式——手写和键盘输入对书写表现的贡献。尽管可以使用键盘,但研究结果强调了手写对书写发展的重要性[50]。
库兹涅佐夫等人使用激光散斑对比成像评估笔迹,这是一种对压力和运动敏感的技术[51]。激光散斑对比度成像仅需要使用简单的激光二极管和相机来采集图像,因此是一种经济高效且实用的笔迹分析工具,特别是笔迹压力和运动学评估。
毕等人写到,正确的握笔姿势对于书写效率和质量起着重要作用,特别是对于早期教育而言。本文对该系统进行了详细的设计和评估,该系统可以通过智能手表识别书写中文和拉丁文时的握笔手势,改善用户的书写习惯[52]。
1.3 笔迹的健康、医学和/或神经学方面
作为一种高级运动技能,手写通常被用作各种状况的预测指标,或健康状况进展的标志。笔迹检验人员必须了解,许多条件会对笔迹产生不同的影响,以及在法医检验过程中如何解释这种影响。以下文章讨论了与书写相关的与健康、医学和/或神经学方面相关的各种状况。
对阿尔茨病患者书写的签名的研究[53]表明,签名形成的时间、空间和流畅性特征与健康书写者的签名没有差异,并且签名动态在一年内基本保持稳定。作者还发现,对于风格化和混合的签名,动态签名特征变异性和痴呆严重程度是相关的。
认知障碍是指认知缺陷大于特定年龄和教育水平的人的预期,但不会显著干扰受影响者的日常生活。在Cilia等人提出的研究中,使用特征选择方法来通过笔迹分析来确定预测与认知障碍相关的症状的最有效特征。目的是加深对受这些疾病发作影响的不同认知功能的了解,并提高为支持其诊断而开发的工具的性能[54]。
Talker等人[55]评估了自闭症谱系障碍(ASD)儿童的精细运动协调能力。这种发育障碍的特点是沟通困难,其中包括言语产生错误的发生率很高。作者推测这部分是由于运动协调和控制方面的潜在缺陷造成的,这也表现为面部表情和目的性手部动作精细运动控制的退化。在这项试点研究中,计算了五名自闭症儿童和五名神经发育正常儿童在言语和手写任务中的声音、视频和手写时间序列的相关性。结果突显了语音子系统之间和手写过程中协调复杂性的差异,并有助于区分两个部分。
另一篇论文[56]对手写分析文献进行了回顾,撰写分析支持阿尔茨海默病(AD)和帕金森病(PD)以及轻度认知障碍的诊断,目标是更新最先进的研究。该研究还旨在提供一些关于用于表示手写的特征的指南,并回顾了一些广泛使用的手写建模方法。卡多拉等人发表了另一篇文献综述,将该主题分为三个主要部分:自然书写、以AD为重点的老年或体弱书写,以及可用的治疗方法和药物及其对书写产生的影响。本文的核心目的是为FDE提供涉及AD患者书写的案例参考[57]。
阿方索等人还写了有关阿尔茨海默病(AD)和轻度认知障碍(MCI)患者的书写困难的文章[58]。在他们的研究中,测量了书写延迟、字母间持续时间、平均笔划压力和错误数量。结果显示,对照组和两组患者的书写延迟和错误数量存在显著差异。然而,在字母间间隔或平均笔压方面,仅在AD组和其他组之间存在显著差异。讨论了这些结果对于理解AD和MCI中拼写障碍的相关性。
Stegemoller等人进行了一项研究,比较了患有帕金森病(PD)的人的画圈表现,这些人的手指重复运动受到损害,而没有受到损害的人则没有。他们的结果表明,不同的运动控制机制可能在帕金森病患者精细运动任务的表现中发挥作用[59]。另一项研究提倡使用书写练习来改善帕金森病患者的精细运动功能[60]。考尔等人[61]进行了一项专门针对PD对各种笔迹特征影响的法医检查的研究。在这项研究中,从70名参与者中随机收集了帕金森病发病前后(用药前和用药后)的笔迹和签名样本。这些笔迹被单独评估,并通过定性和统计方法对各种笔迹特征进行相互比较。
克雷斯波等人的一项研究旨在探讨几种笔迹测量方法在精神分裂症谱系障碍和双相情感障碍患者运动异常研究中的价值[62]。与对照组相比,患者的笔迹特点是速度和加速度显著下降,长度、不流畅和压力增加。结果表明,患有精神分裂症谱系障碍或双相情感障碍的参与者表现出明显的运动障碍,并且这些障碍可以通过手写运动的测量轻松量化。此外,他们认为运动异常是几种精神障碍的核心特征,并且它们似乎与药物治疗无关。
阿亚兹等人[63]检查了双相情感障碍患者在躁狂期和缓解期的笔迹是否有变化。这项研究的结果确定了双相情感障碍患者在躁狂期的笔迹发生了严重变化。具体来说,关键结果证明了双相情感障碍患者笔迹的变化,在躁狂发作期间观察到字符更大,并且笔迹特征可以用作双相情感障碍缓解的筛查工具,以及预测转为躁狂症的工具。
卡利朱里等人报告了有症状和前期亨廷顿病(HD)的手写运动异常。在这项研究中,作者[64]发现,与健康对照组相比,HD参与者的笔划持续时间明显更长且变化更大,笔迹流畅度下降,笔压增加且变化更大。他们的研究结果支持了手写运动学动态测量作为HD潜在早期行为生物标志物的临床实用性。
FDE认识到运动障碍、特发性震颤(ET)的影响非常重要。研究调查了ET与焦虑和睡眠障碍之间的关系[65]。另一篇文章[66]提出了一种基于手写和神经影像分析相结合的ET早期临床诊断和监测的新方法。
另一种可显著影响个人笔迹的疾病是类风湿性关节炎(RA)。赛尼等人报告[67]对受影响者在受影响之前和受影响之后的著作进行定性和定量分析,以及对这些著作的模拟。他们的研究结果表明,几乎所有笔迹特征都因这种疾病而显著恶化,例如线条质量和字母形状,但倾斜、润饰和覆盖不受影响。他们进一步表明,受RA影响的人的书写可以通过识别非正常特征区分开来,如人工颤抖、犹豫、精致修饰、不自然的提笔。
2019年,Zabuha等人写到迫切需要研究老年人的签名。在从成熟到高龄的过渡过程中,笔迹发生了重大变化,过去50年来,全球高龄人口数量显著增加。作者指出的一个问题是,专家在没有利用同期样本材料的情况下对签名进行死后笔迹检查。作者得出结论,尽管进一步的实验研究可以改进这一点,但先前开发的用于对老年人书写进行法医调查的方法仍然有效且相关[68]。Vessio[69]的一项相关研究概述了研究动态手写分析在神经退行性疾病评估中的应用的相关文献,而Impedovo等人提出了一种基于手写的检验规则,集成了手写/绘图任务,以提供“认知模型”用于评估健康受试者以及认知障碍患者的认知功能和手写过程之间的关系,可用于检测和监测神经退行性痴呆[70]。
对老年人笔迹的研究包括对老年人和老年人书写的简短手写记录的检查[71]。本文试图通过文献评估和法医实践来证实和系统化老年人和老年人的简短手写记录研究的理论知识。作者考虑了书写技能形成的生理机制,以及在衰老过程中由于各种条件而导致的特征如何变化,包括运动协调障碍、肌肉骨骼系统、神经系统、循环障碍等可能影响书写特征稳定性的因素。遗嘱、销售和捐赠合同、银行文件通常由老年人和高龄人士在因长期严重疾病而死亡前不久签署。老年人书写运动技能的功能特征会导致运动节奏减慢、幅度和速度降低以及运动的可塑性降低。
一篇有趣的文章报道了一个右利手高加索人的案例——一位妇女在非动脉瘤性、非创伤性蛛网膜下腔出血后出现了镜像书写。鉴于自然镜像书写的罕见性,FDE团体对此类案例研究特别感兴趣[72]。
1.4 笔迹结果的解释
马奎斯等人的一篇文章详细介绍了手写X标记的法医调查和评估评估[73]。他们设计了一项实验研究,收集了75名右撇子和25名左撇子作家的X标记,并根据笔划顺序进行分类。这项实证研究的结果首先用于评估作者的惯用手,以及关于误导性证据风险的发展,作为衡量方法性能的指标。然后,这些结果被用来评估一个已知的人而不是一个未知的人的写作能力。本文表明,遵循ENFSI的证据解释建议可能只需要收集一小部分数据集即可满足案件需求。任何有兴趣对为评估特定案件结果而收集的简单数据应用贝叶斯方法的审查员都可以遵循本文中详述的证据解释程序,如果这涉及X标记或任何其他标记的手写签名或信件。
瓦斯特里克等人发表了他们关于频率出现次数的研究,他们的手写数字特征扩展列表的出现[74]。当前和未来后续研究的前提是通过增加特征数量和作者数量来逐步扩展初始信息列表。作者总共选择了34个数字特征作为本研究的候选特征,并通过属性一致性分析进行测试。根据测试结果,17个新功能已添加到比例列表中。
1.5 会议演讲和研讨会
在本回顾文章书写期间,已就本文涵盖的主题在各种专业会议上进行了多次演讲。这里不描述这些演讲,但提供如下参考。关于笔迹和签名检查,进行了32次演讲[75-106],其中3次演讲专门涉及笔迹签名检验[107-109],1次演讲涉及X标记[110]。有10个关于影响笔迹的因素的演讲[111-120]。两场演讲涵盖了非拉丁手写脚本的主题[121, 122],另外两场演讲涵盖了笔迹样本收集[123, 124]。在此期间举办了一次研讨会,讨论笔迹检查——特别是签名[125]。
2. 电子签名/笔迹
这个文献综述中相对较新的主题包括28篇文章、6个研讨会和30个会议演讲。鉴于许多应用程序都转向数字捕获签名(DCS),法医笔迹审查员正在花费大量时间来研究和分享分析的最佳实践。
2019年,Caligiuri和Mohammed[126]分析了数字捕获的签名的动态特征,以检验以下假设:与年龄相当的健康受试者的签名相比,阿尔茨海默病(AD)签名特征将显示出更大的变异性。作者使用非墨水笔和数字化平板电脑收集了AD型痴呆症患者的335个签名,以及对照组的358个签名。总体而言,结果表明签名书写在AD中得以体现。
李等人[127]旨在制定一种使用数字手写板自动评估学生中文笔迹倾斜度的方法。分析了学生汉字笔迹的斜度和坡度特征以及其他人口统计和笔迹特征之间的关系,结果表明这种关系可以作为特殊教育需求诊断的指标。
迪亚兹等人[128]提出了一组新颖的拟人化特征用于签名验证。这些特征是在数字平板电脑上签名时使用笔尖位置和方向生成的,并通过模拟签名时的肩部、肘部和手腕来表征运动。
安杰利洛等人[129]提出了一种基于在配备电子笔的数字化平板电脑上开发的测试来自动检测痴呆症的新技术。测试测量反映了手写过程的动态,特别是笔未与书写板表面接触时的空中轨迹暂停和犹豫。然后,手写测量结果可以作为机器学习算法的输入,以实现疾病检测的自动化。
Dziechciaruk的文章[130]的目的是分析曲率与手写执行速度之间的相互作用:直线或柔和的大弧线比短而弯曲的弧线执行速度更高。书写速度和笔迹曲率之间的相关性可以通过应用等时性原理在数学上表达。该论文还演示了这种相关性如何帮助评估图形线条的质量。
2019年,为了解决开发使用手写笔平板电脑签名研究方法的问题,哈萨克斯坦共和国司法部法证专家中心的专家组成了一个委员会法医笔迹和计算机技术专业领域[131]。Ismailov的文章报道了学习外国法医文件审查员处理电子文件的经验并为哈萨克斯坦开发方法的工作。
在波兰司法部自2014年起实施的电子收件确认(Elektroniczne Potwierdzenie Odbioru - EPO)计划中,收件人通过数字捕获的签名的方式签署送达确认[132]。Dziedzic和Ferenc的研究目的是通过分析记录的数字数据类型并验证计算签名最重要参数的可能性,评估基于EPO系统中捕获的签名生物识别数据用于法医笔迹检查的适用性。
Geistova等人的一篇基础文章。提出了由与ENFHEX(ENFSI)相关的法医笔迹审查员(FHE)在一个旨在定义数字捕获签名法医检查最佳实践的项目中起草的建议[133]。本技术说明由FHE编写,旨在为数字捕获签名技术的硬件和软件开发商、供应商和用户机构提供有关FHE进行法医笔迹检查所需的最佳信息的指南。
富格尔斯比等人[134]进行了一项实验,部署自动特征提取程序来生成特征相异性分数和总体分布函数,以便对不同短语和手写风格的手写短语对之间的这些特征相异性按分数进行排名。第二个实验是利用这些相异性分数和分布函数来设计一系列复杂案例场景供FDE评估。这项研究表明,使用自动化流程获得的特征相异性分数及其分布与支持两阶段评估框架的启发式价值的FDE决策流程密切相关。
托洛萨纳等人设想传统的身份验证系统通过结合动态手写生物识别信息得到增强[135]。这项研究评估了将生物识别技术融入基于密码的移动身份验证系统的优势和潜力,要求用户用手指在设备触摸屏上画出密码的每个数字,而不是通过打字来输入数字。
胡等人的文章[136]提出了一种新模型(SSDCNN),它利用汉字的笔画序列信息和八向特征进行在线手写汉字识别(OLHCC)。SSDCNN通过结合笔画的自然序列信息,结合八个方向特征来学习OLHCC的展示结果。该模型经过实验评估,结果报告SSDCNN的准确率为97.86%,其自适应版本的准确率为97.94%。
Heckeroth等人[137]比较了数字捕获的签名和传统签名。注意到这两种签名之间在统计上显著的特征差异。然而,对于审查人员来说,这些因素并不限制这两种签名之间的可比性,而是要谨慎对待。
Linden等人[138]执行了签名获取过程,其中选定的签名在涉及有争议签名的假设场景中充当参考和控制材料。采集过程中的其他签名被用作背景数据,以告知有关模型参数的先验分布。参考不同的模型、背景数据、特征选择和参考签名,观察到不同程度的准确度。虽然结果令人鼓舞,表明从动态签名中收集的选定特征可能具有可判别性,但这项研究强调了当前在存在动态签名的情况下推断书写者身份的方法的局限性,并建议应为每个案例收集一组新的数据。
Zimmer等人[139]比较了用26种不同的硬件和软件组合捕获的数字签名。他们发现,当使用不同的硬件和软件组合时,数据的缩放和编码会发生显著变化。建议对签名大小进行标准化,但是,即使对签名数据进行标准化,使用各种解决方案捕获的数据仍然可能表现出差异。
Guerra-Segura等人[140]研究了签名验证,以改进签名的捕获、处理和分类。本文提供了有关签名验证的良好背景信息,并提出了一种新颖而强大的非接触式空中签名验证系统,因其稳定性和良好的性能而被选中。基于对100位书写者(每人书写了10个真品和10个赝品)的研究,作者测试了一种商业设备来表征空中笔画,与其他技术相比,取得了非常好的签名验证结果。
另一篇关于在线签名验证的文章解决了模式识别领域这项任务的挑战[141]。这项任务要克服的主要挑战是一个人内部的笔迹变异性(类内变异性)以及与其他个体相比的笔迹变异性(类间变异性)。作者提出的五模型系统在应用于公共数据集的真实签名时达到了100%的分类准确率,在一个数据集上训练并应用于其他数据集时达到了99%以上的准确率。
贝古姆等人[142]还提出了一种使用数字笔平板传感器数据进行用户身份验证的模型。他们的研究提出了一种强大而高效的用户识别系统,使用基于笔和平板设备传感器信号特征的最佳特征选择技术。实验结果以较低的计算成本实现了足够准确的用户识别结果。
尤纳斯等人[143]使用Apple Pencil、数字传感器笔和iPad作为数字传感器屏幕来捕获新的在线手写数据集。目的是开发一个功能集,可以将在线书面序列分类为文本、数学表达式和图表,以供进一步研究之用。
卢纳迪尼等人[144]在传统墨水笔的基础上开发了一种带有力和运动传感器的智能笔,可用于评估自然手写。这项开发旨在测试智能笔及其传感器,与算法相结合,并利用该技术来检测与年龄相关的笔迹变化,例如颤抖。作者报告了该技术的良好验证,并且年龄相关分析的结果很有希望。该测试涉及43名健康的老年人和年轻人,据观察,老年人的笔迹特点是时间书写量增加、书写压力更均匀、以及更多重复和可预测的颤抖成分。据作者介绍,这款智能笔结合了数字化平板技术的优点和传统纸笔的自然易用性。
夏尔马等人[145]对数字捕获的签名与笔纸签名进行了比较分析。本研究的目的是确定同一个人使用手写笔在数字书写板上和使用传统书写工具在纸上书写的两组签名之间的差异。分析了两个签名之间在类和行质量特征方面的异同。据观察,尽管同一书写者产生的签名之间存在差异,但仍然可以确定数字捕获的签名的书写者身份。
诺拉斯科-弗洛雷斯等人[146]研究了用于PD书写困难诊断的计算机决策支持系统。作者在已经使用的时间、运动学和统计特征中添加了光谱和倒谱特征,并且他们提出的模型降低了计算复杂性,将分类精度提高到98.57%,并且在所有工作上都优于传统的最先进模型。
Faundez-Zanuy等人[147]提出了在线笔迹采集的压力表征和标准化程序。他们的目标是分析用户使用一支手写笔注册签名的真实场景,然后使用具有不同压力响应的不同手写笔模型生成测试样本。测试证实,触控笔压力响应不是线性的,并且测试的不同触控笔具有不同的响应。由于压力是写入标识的一个有用特征,因此该参数不能被丢弃,因此归一化是签名验证的重要因素。
事实上,在数字捕获签名(DCS)解决方案中,力被捕获并呈现为压力水平,但是技术制造商并未提供所施加的力和指定压力水平之间的关系[148]。这个研究团队使用三种不同的数字化仪、六种不同的触控笔和四种不同的捕获软件的组合构建了实验来显示这种力-压力关系的相关性。通过校准和使用Zeta函数,他们开发了一种DCS数据力标准化方法。
在这项研究中,林登等人[149]测试了基于贝叶斯因子计算的概率模型,以评估多元数据形式的动态签名证据。研究了数据稀疏性、特征组合和特征判别力。结果显示,即使可用的参考签名数量有限(5个),准确率仍高于90%,并且15个签名足以获得准确且可重复的结果。结果还表明,表征动态签名的全局特征是相关的,因此建议采用多变量方法,并且特征选择应针对具体情况。
2019年发表了几篇文章,但在本次综述开始之前就可以在网上找到,因此由于它们的相关性而被包含在参考文献中,但它们在本文中没有详细说明[150-153]。
在审查期间,DCS的这一主题在会议演讲和研讨会上广泛流行,共举办了30场演讲[154–183]和6场研讨会[184–189]。这些演讲的主题范围从动态数据和空中轨迹到DCS硬件和软件以及样本收集,此处未进行描述,但已提供参考。
3. 自动化分析系统
在文件检验的领域,用于笔迹和签名分析的自动化系统的使用甚至知识一直非常匮乏。然而,一些实验室已经在这个领域工作了几十年,并努力将研究自动化系统的学术界和行业的专业知识引入法医学的操作点。正是出于这个目的,本节包含在本文献综述中。
虽然针对与手写和签名分析相关的各种任务的自动化系统的各个方面的研究很重要,但参考部分中包含了一本相关教科书[190]和104篇文章[191-294],以及35个会议演示文稿,包括研讨会[295–329]。这些参考文献来自各种期刊,旨在让FDE读者和管理者了解有关笔迹法医检查的科学现状。由于参考文献较多,此处不再一一描述。
审查期间出现的重点文本是Fischer等人的:手写历史文献分析、识别和检索——最先进的技术和未来趋势[190]。本书讨论了历史手稿的布局分析、笔迹识别和检索的整个处理链,包括相关的研究项目和未来趋势。作为文本,这项工作为法医界提供了有关自动化系统的基础使用背景。
Faundez-Zanuy等人[191]对E-SECURITY安全和E-HELTHY健康应用中的手写分析和签名生物识别进行了回顾,指出从人类行为的角度来看,在线手写生物识别可能比其他方式更具吸引力和信息量。作者得出的结论是,手写分析的安全和健康应用不再被视为独立的领域,生物识别手写信息的识别和健康特性的结合才是一个目标。
迪布等人[192]提出了一种基于生物识别的识别系统,用于文件检验以便能够识别文件的作者。本研究的目的是开发一种在线文本独立的多语言作者识别系统,该系统基于能够有效表征生物特征、运动学和图形数据的新功能。作者提出了一种新模型,经过预处理和处理后,从在线笔迹中提取静态和动态特征分割笔划,然后使用深度神经网络作为分类器。该系统在拉丁文和阿拉伯文方面优于现有的作者识别系统,并有望用于法医笔迹检查。
石原慎太郎[193]使用基于分数的方法和词袋模型来估计似然比。使用不同的距离度量来测量比较文档的分数。对于所有文档长度,使用任意数量的最常见单词的余弦距离可以获得最佳结果。测试的文档长度分别为700、1400和2100字。
Ishihara和Carne[194]通过将基于分数(单变量)的方法与基于泊松模型构建的用于估计文本证据的LR的三种基于特征(多变量)的方法进行比较,继续了这项研究。对数似然比成本表明基于特征的方法优于基于分数的方法,并且特征的选择可以提高基于特征的方法的性能。
Shaus等人使用增强的书写识别算法,结合法医文件检查,检查了可追溯到约公元前600年[195]的ostraca(壶上的墨水铭文)的笔迹。这项研究的目的是预测圣经犹大王国一个地区的识字水平。本研究对18个铭文进行了笔迹分析,包括150多个对书写者身份的成对评估。该检查由两种新的算法笔迹分析方法进行,并由专业的法医文件检查员独立进行。这项研究表明,这些独立调查方法的结果之间有很大的一致性,同时证明了公元前7世纪后期犹大军事和行政机构的广泛识字率。
波波维奇等人的这项研究[196]在古文字学中采用了一种创新方法来确定当书写风格接近统一时可以识别多少位书写者。在这项对《大以赛亚书》卷轴(1QIsaa)的研究中,模式识别和人工智能技术被用来创新卷轴的古文字学,提供了新的、切实的证据,证明古代圣经文本不是由单个抄写员抄写的,而是由多个抄写员抄写的,合作制作一份特定的手稿。
Juola[197]使用计算机程序来比较已知文档和有问题的文档,以确定它们是否为同一书写者所写。以五种不同的方式对文档进行分析(使用的单词、单词长度、字符n元语法、最常见的单词、标点符号),并将结果组合用于生成最终答案。该程序在大型数据库上进行了测试,测得的准确率为77%。
对特定手写模式集(例如个人的书写速度)进行自动书写者验证/识别是一项具有挑战性的任务,特别是当系统使用同一个人的不同书写模式集(例如正常速度)进行训练时。阿达克等人[198],通过实验分析是否存在对高内变量笔迹不敏感的隐含个性特征。他们研究了高度内部变量的离线孟加拉语书写的书写者识别/验证。该团队从两组不同的100名书写者生成了两个手写数据库,并通过数据增强技术扩大了数据集以进行测试。作者发现,虽然他们的自动化系统通过预训练得到了改进,但他们的方法对于最初的目标来说表现不佳。
富格尔斯比等人[199]研究了两个系统之间的关系:FLASH ID®(一种自动手写/黑匣子系统,使用从静态手写图像中提取的测量值)和MovAlyzeR®(一种从笔划捕获运动学特征的系统)。在他们的研究中,作者收集了33位书写者的草书和手写体各60个短语,从而产生了数千个样本对进行检查。使用两个系统处理这些配对样本的书写特征并分析输出分数。观察到的结果表明,基于使用 FLASH ID® 系统使用的静态图形特征和运动学空间几何笔划特征(例如幅度和倾斜)的相异性分数与相异性具有统计上显著的关系。这些结果表明,使用开放笔迹运动学特征分析系统进行生物特征识别研究支持基于黑盒算法的生物特征匹配算法的有效性。
Kurowski 等人的团队还研究了签名认证的自动分析方法[200]。开发的系统分析了从生物识别笔传感器获得的动态特征以及静态特征(即签名的形状);通过将动态数据(例如笔倾斜、压力和速度)添加到签名的整体形状中,他们发现身份验证系统结果得到了显著改善。
在法医学中利用机器学习因其几乎不可证伪的性质而受到阻碍[201]。马西诺夫斯基致力于开发一种顶级可解释神经网络,用于识别手写文档的书写者,该网络将满足法医和科学标准,并且具有良好的准确性。
克劳福德等人[202]重点关注使用书写形状将个人笔迹与出处未知的文档进行比较的问题,就像在法医应用中所做的那样。他们提出了一种处理扫描手写文档的方法,将书写内容分解为小的图形结构(通常对应于字母),然后引入两个此类结构之间距离的度量。这些测量结果是基于结构属性对图进行聚类的算法的基础,从而创建用于对新文档进行排序的模板。贝叶斯分层模型用于捕获作者生成分配给某些集群的图表的倾向,从而提供身份评估。
鉴于自动化和机器学习领域有多个会议专门讨论手写分析的各个方面,因此在本次审查期间进行了许多演讲,需要进行评估才能纳入本文。其中一些精选内容包含在参考部分[295-329]中,但此处不进行描述。
4. 压痕显现
潜在文字和标记的压痕开发是法医文件检查中使用的经典方法。三篇文章、十次会议演讲和一场研讨会专门讨论了用于开发和解释潜在压痕的技术。
萨迪克等人[330]测试了使用可擦记号笔墨水作为碳粉的替代应用,以在使用ESDA充电过程后形成压痕。结果显示,可以用可擦记号笔墨水替代碳粉,11份文档中的7份(10/11使用碳粉)的结果是成功的,但质量却相当低。
韦尔奇进行了一项小型研究[331],专门调查通过塑料文件钱包形成的手写压痕的成像现象。这项初步研究的结果与之前的工作一致,但提出了进一步研究各种成分的塑料薄膜对凹痕和浮雕笔迹静电检测的影响的问题。
Green[332]研究了橡皮图章图像到文档上的转移,其中橡皮图章印象在潜在压痕处理时被揭示。这项研究中值得注意的是,这些邮票源自文件的运输环境,并且由于墨水的化学成分而不是手写压痕测定中与笔压力笔画相关的典型纸张纤维干扰而能够被破译。
与前面的部分一样,关于该主题的会议演讲[333-342]和研讨会[343]此处未描述,但包含在参考部分中。