人工智能今天能为你做什么?生成式人工智能如何改变技术文档领域

▲ 搜索“大龙谈智能内容”关注GongZongHao▲ 

作者 | Fabrice Lacroix

大型语言模型(LLM)和生成式人工智能(GenAI),尤其是ChatGPT,这些是引领科技革新的新兴技术。它们不仅在科技界引起了轩然大波,也让每个企业的利益相关者深感震撼。人们纷纷尝试探索人工智能将如何影响、协助并改变他们的工作流程和组织运营模式。对错失机会的忧虑正在持续升温。领导者们急切地想要了解,在整合人工智能功能方面,他们是否会落后于竞争对手。这是不是就意味着,如同陨落的流星,它将摧毁那些行动迟缓的“恐龙”组织呢?虽然时间会揭示一切,但正如安迪·格罗夫所警告的那样:“只有偏执狂才能生存”。在这个快速变化的世界中,只有保持警觉并积极适应新技术的企业才能持续地生存和发展。

然而,不可否认的是,人工智能所孕育的机会已经大量涌现。在内容创作到消费的整个流程中,人工智能带来的变革已经深入到以下方面:

  • 创建:变革创作流程

  • 验证:管理跨版本、时间和来源的信息一致性

  • 翻译:以更低的成本走向全球

  • 发布:帮助用户自我培训

  • 搜索:重塑搜索体验

  • 阅读:增强客服

下面,我们描绘人工智能已经实现的重大变化。

- 1 -

变革创作流程

关于生成式人工智能是否可以用于编写技术文档,存在一些争议。有人认为GenAI怎么可能知道新发明产品的细节呢?毕竟,技术信息需要真实,我们不能冒险让人工智能产生“幻觉”的风险。

在Fluid Topics,我们坚定地支持一个理念:即公司中的每一个人,而不仅仅是技术作家(TW)和领域专家(SME,也就是开发产品的工程师),都可以为内容创作贡献力量。

Fluid Topics 有能力汲取各种类型的内容,包括非结构化的文档如Word文件,这通过让每个贡献者使用他们钟爱的工具来实现。构建统一的知识库并不意味着将单一的创作工具强加给所有的内容贡献者。然而,向这种新范式的转变需要TW改变他们的工作模式,成为编辑(Editor)和文案撰稿人(Copywriter),而不是采访者(Interviewer)和作者(Author)。而这正是人工智能可以发挥作用的地方。

现在,通过使用GenAI来重新措辞内容并遵循通用或企业标准,领域专家可以专注于内容创作,而不必过分担心语法、拼写和风格的问题,同时也不会给TW增加过多的工作负担。这样的结果导致领域专家和TW的工作流程发生了巨大的变革

  • 领域专家可以更加快速地进行写作,利用GenAI进行现场内容重新措辞,并检查GenAI所提供建议的准确性和真实准确性。对于领域专家来说,写作、改进和检查的过程变得更加动态和实时化,而TW在这一过程中不会过早参与进来。

  • 只有在领域专家完成他/她的工作之后,TW才会对内容进行审查。TW将专注于执行更具增值性质的任务,例如将这些新内容与现有内容进行对齐,并将其融入到更大的内容故事中。

关于这一新范式的一个问题是:它如何与内容质量检查工具(例如Schematron、Acrolinx或Congree)相互补充或替代?当然存在一定的重叠,但目前这些工具大多是相互补充的。在此过程中,质量检查和公司规则执行是在GenAI之后进行的,尽管这种情况将来可能会发生变化。事实上,这些供应商有可能将GenAI集成到他们的产品中,以提供支持SME-Author范式的全功能工具。

- 2 -

管理一致性

知识管理和技术文档的主要挑战之一是随着时间的推移和跨来源保持准确性和一致性,从根本上避免矛盾的信息。

这是一个人们耳熟能详的故事:一本手册详细阐述了产品版本1的流程,另一本指南则介绍了如何对产品进行故障排除。同时,为了支持这一过程,代理撰写了一篇包含相关提示的文章。然而,经过几年的产品迭代,目前最畅销的产品已经经历了两次重大演变,并衍生出四种不同的变体,同时远销三个不同的海外市场。

随着产品的不断演变和市场的不断拓展,相关的文档也应该得到相应的发展。然而,事实是否真的如此呢?所有翻译的内容是否都准确无误呢?为了制作快速入门指南而进行的复制粘贴操作,是否确保了内容的时效性和准确性呢?还有,帮助台工具中的所有知识库文章是否也得到了及时的更新和完善呢?

这是每家公司都需面对的挑战:即便技术内容信任度未受影响,它仍可能阻碍生产力,并降低公司的安全防范水平。单一来源——即使用一个工具编写所有内容——或许看似能解决此问题,但现实证明,这一方法在大规模操作中收效甚微。每位利益相关者都倾向于选择自己偏爱的创作工具(自然,我们无法强求产品营销部门的人员使用DITA进行编写,对吧?),更不必提及他们还需将内容复制粘贴至Word文件、各类文章乃至电子邮件中。

人工智能正是在此发挥其作用。它可以读取文档的所有版本以及团队生成的所有信息,并检测出其中的不连贯和不一致情况。它能够识别出哪些内容需要进行更新,并实时对生产进行检查。无论是在编写内容的过程中,还是在利用内容进行其他操作时,系统都可以自动核查其与现有材料的一致性。

人工智能在维护全面、一致且可靠的信息库方面具有巨大的潜力,这也进一步为每个利益相关者提供了成为内容贡献者的机会。

- 3 -

以更低的成本走向全球

对于进行全球销售的公司来说,一个关键的决策就是需要将多少内容翻译成多少种语言。翻译代表着金钱和时间方面的成本,翻译内容的可用性可能会延迟文档的发布(如果不是产品本身的话)。

机器翻译 (MT) 在过去十年中的进步有助于降低财务成本和缩短生成翻译所需的时间。事实上,机器翻译已经变得如此出色,以至于人们现在开始考虑是否有可能仅依靠机器翻译,将人类从翻译过程中完全剔除。

回答是肯定的,有三个原因:

  • 技术文档的编写从语言的角度来看是明确且易于掌握的。没有冗长而复杂的短语,没有双重否定、讽刺或轻描淡写。在大多数情况下,易于阅读意味着易于翻译。

  • 词汇本身是有限的。即使它可能包含大量术语,这些术语也是众所周知的。术语表和翻译记忆库包含所有必要的细节,以支持机器翻译引擎的专业化。

  • 如果你之前“手动”翻译过,并经过专家审查和修复,那么你就有了经过验证的翻译历史,这正是训练现代机器翻译引擎并获得更好结果所需要的。

最近的实验表明,机器翻译已经足够好,企业可以完全依赖它,而无需人工验证。请注意,当前的 DNN(深度神经网络)引擎仍然比基于 LLM 的翻译好一点,但两者的结合在未来可能会产生更高的准确性。

这对你来说意味着什么?简而言之,您可以大大简化您的发布工作流程。

试想一下,当你的内容以源语言形式编写完成后,可以毫不改动地发布到你的内容交付平台上,并且能够即刻以你所期望的多种语言展示出来:无论是10种、20种,甚至40种或更多。无论数字是多少,关键在于对内容的即时翻译,让你的内容在用户面前呈现出如同使用了23种语言般的丰富性,即使在草拟阶段其实只使用了一种语言。这包括用户的搜索查询、搜索结果页面以及展示的内容,所有这些都要求做到实时的翻译转换。

你也可以选择在预翻译内容(基于机器翻译,有或没有验证)和实时翻译之间平衡你的策略。例如,您可以使用英语创作,用日语和中文进行预翻译和验证,用西班牙语和法语进行预翻译而不进行验证,并通过实时翻译提供18种其他语言的属性访问权限,因为拥有更少的客户。可能性是无止境的:只有客户和合作伙伴可以访问即时翻译;您可以利用读者的反馈来发现翻译问题;您可以限制预翻译或验证到阅读最多的内容。内容使用分析在这里肯定有很大的帮助,并将帮助您做出最佳决策。

图1:即时机器翻译为传统的预翻译提供了一种灵活、经济的选择。

- 4 -

帮助用户进行自我培训

技术文档的内容涵盖广泛,因此必须准确且全面。然而,有时这种准确性是以牺牲可读性为代价的,导致用户难以快速搜索并找到他们所需的信息

想象一下,一名技术人员在试图理解一项维护任务,但是面对着一个长达40页的程序文档,其中每一个可能的细节都得到了详尽的描述。这时,一种能够简化阅读负担的方法叫做“渐进式披露”。这种方法通过使用可折叠和展开的区块,来实现动态地隐藏或显示部分内容。然而,这种方法也给技术编写人员带来了额外的工作负担,因为他们需要对内容进行语义标记,从而让UI知道应该何时显示或隐藏哪些内容。更为重要的是,写作必须以一种即使内容被显示和隐藏的任何组合,对读者来说仍然具有意义的方式进行。不用说,这种披露内容的方式并不适用于所有情况。例如,如果用户想要的信息分散在多个章节或文档中,那么这种方法就会显得捉襟见肘。

这就是LLM发挥作用的领域。他们精于总结和提炼,这就意味着,你可以向他们动态提供那些并非专门为这一目的而准备的内容,然后请求一份包含十行、一页或三页的精准总结。

考虑为想要了解产品特性或功能的用户提供一种新的体验。用户可以先问一个简单的问题:“我如何解决这个问题?”或“需要什么程序?”

文档交付平台可以展示支持的内容,但仅提供了一个概述,而不是直接链接到页面的建议,从而迫使用户深入了解这些内容。此外,读者可以将内容标记为书签以供将来使用,并根据需要查看详细信息。

GenAI在信息发现和自我训练方面无疑具有巨大价值。它可以从海量基础文档中自动提炼出更简洁或独特的内容。这不仅有助于解决培训新手时必须创建特定内容的难题,这是一项成本高昂的任务,而且还可以避免随着产品的发展,必须将培训材料与技术文档重新同步的问题。简而言之,GenAI开辟了新的可能性,能够自动生成所需内容,从而节省了大量时间和资源。

- 5 -

重塑搜索体验

在过去的十年里,随着语言模型和概率评估的崭新应用,搜索引擎取得了巨大的进步。它们的相关性得到了极大的提升,同时也能实现结果的动态个性化。因此,像Fluid Topics集成的现代搜索技术,对比基于TF IDF的引擎,例如Solr或Elastic,表现出了显著的优势。那些仍然依赖这种过时的技术,同时希望为用户提供优质搜索体验的公司,应该考虑进行更新换代了!

LLM正在推动语言模型领域迈向新的里程碑,助力搜索体验实现飞跃式的进化。经由大型内容集(数十亿页)的训练,LLM在处理自然语言和概念搜索方面表现出色,这与传统的关键词搜索截然不同。然而,其局限性在于作为通用模型,并未专门针对您的内容进行训练。因此,它们对您的产品知识或竞争对手的了解有限,无法为您提供准确且具体的答案。近期的研究与测试表明,仅对LLM进行微调并不一定会产生更出色的结果。因此,在未经深度定制的情况下,LLM在回答特定问题或提供针对您产品的详细信息方面可能有所不足。

但有一条前进的道路。通过正确地结合现代搜索技术和GenAI(即大和小语言模型),你可以获得两全其美的效果,并构建新的查询和交互方式。多种用例是可能的。最明显的包括:

  • 搜索结果整合:用户运行搜索,会列出多个文档,有时来自多个来源(参考指南、故障排除程序等),所有这些都是相关的。打开和阅读每一个回复可能是一项繁琐的任务,但利用GenAI生成一个统一的回复可以提供卓越的用户体验。

  • 问答:人工智能可以直接回复问题,而不是通过关键词搜索返回文档列表,让用户阅读文档来找到问题的精确答案。

  • 对话和帮助:用户可以从一个问题开始,人工智能会用一组内容、该内容的摘要或精确答案回答。然后用户进一步查询系统以进入下一步。想象一下,这个用户与一位熟记你所有内容的专家交谈,在用户解决问题的过程中,通过对话逐段传递信息。

图2:Bing(右边)通过将搜索结果合并为回复,提供了一种新的用户体验。

图3:Bing聊天的一步一步的帮助

- 6 -

增强客服

回复客户提交的支持案例要么很无聊,要么很复杂。

如果说无聊,那是因为用户提出的许多问题都是基本的、反复出现的。支持人员厌倦了重复性工作。为了解决这个问题,支持人员创建了一个专门的知识库,这是一组预定义的答案,如果需要,他们可以复制、粘贴和调整。

如果复杂的话,那是因为剩下的问题不同寻常,而且很高深。这些请求要求客服搜索、阅读、再次搜索、询问专家,并从从多个来源获得的所有文档中得出正确的答案。这就像是通过组装信息来解决一个谜题,然后绘制出一幅漂亮、清晰的画面。客服的经验越少,他们就需要更多的时间和其他客服与专家的帮助。

所有这些都花费了公司的时间和金钱。回复缓慢会引起用户不满。那么,如果你能自动化部分流程,并将回复无聊和复杂案件的时间减少三分之一甚至一半,会怎么样?这就是GenAI所能实现的。

通过巧妙地将搜索技术与生成式人工智能相结合,你可以轻松撰写案例回复。其运作原理就像身边有一位无所不知的专家助手,能够在短短几秒钟内为您提供精准答案。然而,正如所言,错误的信息可能会带来严重的后果,因此不能冒险依赖不完美的AI(当然,人类也并非完美无缺)。

为了实现最佳的回复效果,推荐的方法是结合搜索+GenAI双管齐下。通过这种组合,您可以预先准备好回复内容,并由客服团队进行后续的检查、验证和微调。这样,原本需要五分钟才能完成的任务现在仅需两分钟,原本耗时一小时的任务如今只需20分钟。更重要的是,这还将帮助新入职的客服人员迅速进入角色。他们可以检查机器人程序自动识别的、回复中引用的支持文档,以及生成的回复内容,从而在审查和验证回复的过程中逐步积累经验。无论是提高写作速度、提高回复准确性,还是加快新员工的入职速度,都将带来诸多好处。

图4:使用GenAI提出书面答案可以显著提高客服的效率

- 7 -

结论

这些只是GenAI可以应用于技术文档以转变业务的少数场景,我们可以想到还有许多其他方面例如:

  • 提供更好的内容阅读体验:根据需要解释代码示例或将代码示例从一种编程语言翻译到另一种语言。

  • 智能词汇表:在上下文中解释一个术语,重新表述内容以帮助理解,等等。

  • 协助回复RFI/RFP问卷:问问你的售前工程师,他们有多喜欢填写这些总是相同的电子表格,但又不至于让你盲目地复制粘贴或重复使用。如果可以自动化呢?

  • 从技术文档中获得销售/营销推介和技术故事:建议关于该产品的五个项目符号,建议简短的描述等。

这些无限的机会,恰恰证明了在创造、管理和利用信息以改变客户体验方面所取得的巨大进步。软件平台正在持续进化,以便整合并实现这种转变,这将是一段激动人心的旅程。

你准备好了吗?

原文地址:

https://tcworld.info/e-magazine/intelligent-information/what-can-ai-do-for-you-today-1279/

通过GongZongHao搜索“大龙谈智能内容”联系我们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/164947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web 自动化神器 TestCafe(三)—用例编写篇

一、用例编写基本规范 1、 fixture 测试夹具 使用 TestCafe 编写测试用例,必须要先使用 fixture 声明一个测试夹具,然后在这个测试夹具下编写测试用例,在一个编写测试用例的 js 或 ts 文件中,可以声明多个测试夹具 fixture(测试…

【C++11】default、delete与Noncopyable

C11 oop中的default、delete与Noncopyable default 在C11标准中,可以使用default关键字来显式地声明默认的构造函数和析构函数。 使用default关键字可以用来显式声明默认的构造函数和析构函数。这样做可以让编译器自动生成默认实现 –>->->关于构造函数…

计数排序+桶排序+基数排序 详讲(思路+图解+代码详解)

文章目录 计数排序桶排序基数排序一、计数排序概念:写法一:写法二: 二、桶排序概念代码 三、基数排序概念1.LSD排序法(最低位优先法)2.MSD排序法(最高位优先法) 基数排序VS基数排序VS桶排序 计数…

内容营销频频出圈,这些品牌号做对了什么?

小红书拥有大量的年轻用户,通过运营品牌号既能降低投放成本,又能更好地连接消费者和品牌,在平台完成一站式闭环营销。 今天就借助几个成功案例,来分析下他们是如何搭建官方账号,通过内容运营吸引更多用户,实…

一款专为POS机设计的芯片解决方案

一、基本概述 HCM8003设计用于磁条读卡器系统。它会从F/2F恢复时钟和数据信号磁产生的数据流头HCM8003将用于数据速率从200到15000比特每秒。 二、典型电路 内部数据的采集和跟踪这个范围是自动的。可以应用于POS机终端设备、磁卡门禁系统、身份识别等场合。 三、引脚定义 四…

redis的主从复制,哨兵模式

1.主从复制 主从复制:主从复制是redis实现高可用的基础,哨兵模式和集群都是在主从复制的基础之上实现高可用 主从复制实现数据的多机备份,以及读写分离(主服务器负责写,从服务器只能读) 缺陷&#xff1a…

PyTorch基本操作和工作流程

1. PyTorch基础 张量(Tensors): 学习 PyTorch 中表示数据的基本单元。了解如何创建、操作和使用张量。 自动微分(Autograd): 了解 PyTorch 的自动微分机制,这是训练神经网络的核心。 模型定义…

Android registerForActivityResults使用详解以及实现原理

registerForActivityResult 使用用途是监听Activity结果。 以下是使用样例 //需要传递Request用于解析Intent和解析上个Activity返回的结果 val launchdata = registerForActivityResult<PickVisualMediaRequest, Uri?>(ActivityResultContracts.PickVisualMedia()) {…

中国人工智能系列白皮书 AIGC

https://www.caai.cn/index.php?s/home/article/detail/id/3188.html

【git】使用ssh

前言 git之前一直使用https&#xff0c;因为很方便随时随地都可以用。最近把代码托管到GitHub&#xff0c;使用https就使用不了。后面听同事说GitHub使用ssh是没问题的&#xff0c;就想着尝试一下。 git ssh配置 设置用户名和邮箱 git config --global use.name username g…

OpenCV实现图像噪声、去噪基本方法

一、噪声分类 1、高斯噪声 指服从高斯分布&#xff08;正态分布&#xff09;的一类噪声&#xff0c;其产生的主要原因是由于相机在拍摄时视场较暗且亮度不均匀造成的&#xff0c;同时相机长时间工作使得温度过高也会引起高斯噪声&#xff0c;另外电路元器件白身噪声和互相影响…

acwing算法基础之数学知识--求组合数基础版

目录 1 基础知识2 模板3 工程化 1 基础知识 &#xff08;一&#xff09; 组合数 C n k C_n^k Cnk​的计算公式&#xff0c; C n k n ⋅ ( n − 1 ) ⋯ ( n − k 1 ) 1 ⋅ 2 ⋯ k C_n^k\frac{n\cdot(n-1)\cdots(n-k1)}{1\cdot 2\cdots k} Cnk​1⋅2⋯kn⋅(n−1)⋯(n−k1)​ …

laravel-admin导出excel全部,表中无id列导出失败

laravel-admin导出excel时&#xff0c;导出全部数据&#xff0c;但是表中没有id字段&#xff0c;然后就无法导出excel&#xff1b; 就直接显示 一开始我也很着急&#xff0c;弄了半天还是不行&#xff0c;然后重写还是有问题 最后发现底层代码排序是按照id排序的orderBy(id, a…

Unity地面交互效果——6、地形动态顶点置换和曲面细分

回到目录 Unity置换贴图局部距离曲面细分 大家好&#xff0c;我是阿赵。   这篇文章是我无聊的时候做了一个demo&#xff0c;觉得挺有趣&#xff0c;于是就发上来。这里面包含了4个内容&#xff1a;置换贴图、顶点偏移、局部曲面细分&#xff0c;曲面细分按距离调整强度。 …

JVS低代码表单设计:数据联动详解(多级数据级、数据回显等)

在这信息化时代&#xff0c;表单作为数据的收集和展示工具&#xff0c;已经渗透到不同的角落。JVS低代码对表单的设计和操作进行了不断的优化和创新。其中&#xff0c;联动回显作为一项重要的功能&#xff0c;无论是多级数据级联控制、组件的联动控制&#xff0c;还是多表的数据…

【0基础学Java第三课】-- 运算符

3. 运算符 3.1 什么是运算符3.2 算术运算符3.2.1 **基本四则运算符&#xff1a;加减乘除模( - * / %&#xff09;**3.2.2 增量运算符 - * %3.2.3 自增/自减运算符 -- 3.3 关系运算符3.4逻辑运算符(重点)3.4.1 逻辑与 &&3.4.2 逻辑 ||3.4.3逻辑非 !3.4.4 短路求值 3.5 …

DBS note4:Buffer Management

目录 1、介绍 2、缓冲池 3、处理页面请求 4、LRU替换和时钟策略 1&#xff09;顺序扫描性能 - LRU 5、最近最常使用替换策略&#xff08;MRU Replacement&#xff09; 1&#xff09;Sequential Scanning Performance - MRU 6、练习题 1&#xff09;判断真假 2&#xf…

华清远见嵌入式学习——网络编程——作业4

作业要求&#xff1a;①使用IO多路复用中的select函数实现TCP并发服务器客户端 ②使用IO多路复用中的poll函数实现TCP并发服务器的服务器端 一、 代码 #include <myhead.h>#define SERPORT 8888 //服务器端口号 #define SERIP "192.168.114.113"…

Samsung下origen中uboot的配置与编译

uboot的特点&#xff1a; n代码结构清晰 n 支持丰富的处理器与开发板&#xff0c;易于移植 n 支持丰富的用户命令 n 支持丰富的网络协议 n 支持丰富的文件系统 n 支持丰富的设备驱动 n 更新活跃、用户较多、资料丰富 n 开放源代码 n 较高的稳定性 n 不具有通用性&#xff08;不…