多平台拼音输入法软件的开发

在这里插入图片描述

拼音输入法从上个世纪发展到现在, 已经发展了几十年了, 技术上已经非常成熟了. 换句话说, 就是实际上没多少技术含量, 随便来个人就能手搓一个.

在这里插入图片描述

本文介绍一个简单的多平台拼音输入法软件的设计和实现, 支持 GNU/Linux (ibus) 平台 (PC) 和 Android 平台 (手机).

目录

  • 1 中文输入法简介
  • 2 整体架构设计
    • 2.1 数据
    • 2.2 拼音核心
    • 2.3 图形用户界面
    • 2.4 系统输入法接口与应用
  • 3 具体实现栗子
    • 3.1 架构设计
    • 3.2 拼音核心: 查表+激进学习策略
    • 3.3 PC 平台的界面
    • 3.4 Android 平台的界面
    • 3.5 GNU/Linux 应用 (ibus)
    • 3.6 Android 应用
    • 3.7 安全设计
    • 3.8 输入测量
  • 4 总结与展望

1 中文输入法简介

  • 为什么需要输入法 ?

    省流: 因为汉字数量太多了.

    英文输入计算机非常简单, 因为英文字母只有 26 个, 完全可以在键盘上摆下 26 个按键, 然后按一个按键就输入对应的英文字母.

    但是, 目前 (现代汉语/简体中文) 常用的汉字就有 3000/5000/7000 个. 一组简单的测量数据: 常用 3000 汉字占中文文本中出现的所有汉字的 99%, 常用 5000 汉字占 99.9%, 常用 7000 汉字占 99.99%. 剩下还有几万个, 甚至更多的汉字, 但是很少见了.

    如何输入几千个不同的汉字, 就是一个问题了. 因此产生了许多种不同的中文输入法.

  • 中文输入法有哪些 ?

    根据输入方式可以分为: 键盘输入 (包括实体键盘和屏幕触摸键盘), 语音输入 (语音识别), 手写输入, 光学字符识别 (OCR) 等. 未来可能还有脑电波输入 (脑机接口).

    键盘输入有: 拼音输入法, 形码输入法 (比如 五笔), 音形结合 (拼音+形码) 等.

    虽然有很多种不同的输入法, 但目前拼音输入法仍然是使用最多的.

  • 拼音输入法有哪些 ?

    拼音输入法可以分为 全拼双拼.

    全拼就是输入完整的拼音 (比如 qiong), 也包括简拼 (就是省略一部分拼音).

    双拼就是每个拼音对应两个按键 (比如 qs). 双拼有多种不同的具体方案, 比如 自然码.

  • 拼音输入法有哪些主要挑战 ?

    省流: 重码 (同音字).

    常用汉字有几千个那么多, 但是拼音 (普通话, 不带声调) 只有 400 多个. 所以必然存在一个拼音对应多个汉字的情况, 夸张的时候一个拼音对应 100 多个汉字.

    翻页查找需要的汉字必然很慢, 会大大降低输入效率.

    面对用户这个语焉不详的谜语人, 拼音输入法必须想方设法的去猜, 用户到底想输入什么 ? 然后把用户想输入的东西, 在候选项列表里面尽量往前放, 最好放在第一个.

2 整体架构设计

在这里插入图片描述

作为一个支持多平台的拼音输入法, 整体上可分为平台无关的部分, 和平台相关的部分.

平台无关的部分包括数据, 以及拼音核心. 在各个平台上都是通用的.

平台相关的部分包括图形用户界面, 以及系统输入法接口. 最后需要一个适应相应平台的应用, 来把这些东西装进去.

2.1 数据

输入法核心所需的数据, 以及用户数据库 (学习功能).

比如拼音数据 (拼音和汉字的对应关系), 汉字频率数据, 词库, 语言大模型等. 具体取决于核心使用的方法.

这部分数据需要专门收集, 整理, 准备.

2.2 拼音核心

实现拼音到汉字的转换 (这也是输入法的核心功能).

具体可以使用多种方法. 简单的比如查表, 复杂的比如使用 AI 技术 (语言大模型) 等.

2.3 图形用户界面

不同的设备 (比如 PC, 手机) 需要不同的用户界面.

  • PC 平台 (使用 键盘, 鼠标操作, 一般有 大屏显示器) 具体的设备形态包括: 台式机, 笔记本, 迷你主机 等.

    用户界面主要是候选框窗口, 需要跟随文本光标的位置移动.

  • 手机平台: 用户界面主要是屏幕底部的触摸键盘.

2.4 系统输入法接口与应用

不同的操作系统 (比如 GNU/Linux, Android, Windows) 具有各自不同的输入法接口, 以及应用格式.

  • GNU/Linux (PC) 平台: 系统接口 (输入法框架) 有 ibus, fcitx 等.

    通常系统具有软件包管理器 (比如 pacman, apt, rpm 等). 各个软件由软件包管理器统一安装和升级, 并处理软件包之间的依赖关系.

  • Android (手机) 平台: 系统接口是 Android 输入法框架.

    应用的格式是 apk, 编程语言一般是 JVM (比如 java 或 kotlin).

  • Windows (PC) 平台: 系统接口是 TSF 输入法框架.

    应用格式是 .exe 可执行程序.

3 具体实现栗子

好, 上面把理论部分讲完了, 下面说一个具体的实现.

3.1 架构设计

技术选型的主要目标:

  • (1) 低成本, 快速开发.

    这里是指开发的低成本. 运行性能 (运行速度快, 内存占用小) 相对不重要. 用户体验相对不重要. 也就是说, 这个软件主要是为开发者而开发的.

  • (2) 跨平台.

    所选技术应该能够支持多个平台, 尽量在不同的平台之间多共享代码.

  • (3) 低门槛.

    所选技术应该容易学习, 容易入门, 容易上手, 具有大量的开发者.

没错, 说的就是 web 技术 ! 主要编程语言为 JavaScript.

在这里插入图片描述

拼音核心使用 deno (fresh) 运行环境, 编程语言 TypeScript. deno 是一个类似 node 的 js 运行环境, 使用 rust 编写. 使用 deno 开发比使用 node 更容易, 所以选择 deno. 数据库使用 deno-kv, 底层基于 sqlite.

用户界面使用 vue 框架开发, 经典的 web 技术: js + HTML + CSS. 虽然 PC 和手机的界面需要分别开发, 但因为都在一个 vue 项目中, 两个界面之间也共享了很多代码.

electronjs 是一个基于 chromium 浏览器的壳, 支持 GNU/Linux 平台, 负责把 vue 开发的界面显示出来. 艾刷 (librush) 模块负责与 ibus 输入法框架的接口.

Android 应用使用 WebView (背后还是 chromium) 把 vue 界面显示出来. 同时负责系统输入法接口 (Android 输入法框架).

代码行数统计 (cloc): pmim-server 1936 行 (TypeScript), ui-vue 2396 行 (vue/js), pmim-ibus/electronjs 227 行 (js), librush 1222 行 (rust), pmim-apk 531 行 (kotlin). 代码总数 6312 行 (100%), 平台无关部分 4332 行 (68.6%), 平台相关部分 1980 行 (31.4%), GNU/Linux 平台代码 1449 行 (23.0%), Android 平台代码 531 行 (8.4%).

可以看到, 在这个架构之下, 大部分代码都是平台无关的. 特别是 Android 平台只需要很少的平台支持代码.

3.2 拼音核心: 查表+激进学习策略

相关文章:

  • 《从 Unicode 标准提取拼音数据》 https://blog.csdn.net/secext2022/article/details/136110314
  • 《双拼 (自然码) 的简单实现》 https://blog.csdn.net/secext2022/article/details/136120779

拼音数据从 Unicode 数据库中提取. 词库使用了一个 6 万个词的很小的词库. 拼音切分部分, 实现了双拼 (自然码), 以及自定义双拼表. 拼音转汉字部分, 使用了最简单的查表法, 就是直接查词库.


激进的学习策略, 就是用户输入的东西 永远 优先于内置词库. 会在用户数据库存储用户输入内容的时间和频率 (次数), 查询候选项时, 会根据最近使用时间 (7 天内) 和频率排序.

用户数据库存储在本地, 关于更详细的安全分析请见 3.7 章节.

在这里插入图片描述

比如, 第一次尝试输入 “穷人小水滴”, 由于词库中只有 “穷人”, 所以候选项如图所示.

在这里插入图片描述

输入一次之后, 再次输入, 用户数据库中就有了这个词. 这就是简单的学习功能.

随着使用时间的增加, 用户数据的积累, 输入法会变的越来越好用.

3.3 PC 平台的界面

相关文章:

  • 《使用 electronjs 实现 ibus 输入法的用户界面》 https://blog.csdn.net/secext2022/article/details/136143845

在这里插入图片描述

候选框窗口如图所示. 候选框窗口需要跟随文本光标的位置移动, 并按照需要显示隐藏.

中间显示原始输入 (双拼), 上方显示对应的全拼. 下方显示候选项, 每页 10 个, 按 1 ~ 0 数字键输入对应的候选项. 右侧显示有候选项的页码, 总页数. 按 , . 键翻页. 空格键输入第一个候选项. Esc 键取消输入.

由于这个界面是基于 vue 开发的, 对这个界面进行个性化修改应该是很容易的.

3.4 Android 平台的界面

在这里插入图片描述

这个界面负责卖萌. 点击上方的一行字切换不同的输入界面. 右上角的按钮用来关闭软键盘.

在这里插入图片描述

英文键盘 (默认). 左上角 shift 键 (切换大小写), 右上角退格键 (backspace), 下方大大的空格键, 右下角回车键 (enter).

在这里插入图片描述

英文键盘 (shift).

关于键盘布局的问题, 这个键盘布局被窝称为 abcd7109. 这其实是一种很复古的设计, 因为在 qwerty 键盘布局出现之前, 打字机的键盘是按照英文字母的顺序排列的.

对应源代码 (pmim-ibus/ui-vue/src/im2/c/键盘/键盘布局.js):

// 定义键盘布局 (主键盘): abcd7109
export const 布局 = [// 第 1 行: 7[["a", "A"],["b", "B"],["c", "C"],["d", "D"],["e", "E"],["f", "F"],["g", "G"],],// 第 2 行: 10[["h", "H"],["i", "I"],["j", "J"],["k", "K"],["l", "L"],["m", "M"],["n", "N"],["o", "O"],["p", "P"],["q", "Q"],],// 第 3 行: 9 + 1[["r", "R"],["s", "S"],["t", "T"],["u", "U"],["v", "V"],["w", "W"],["x", "X"],["y", "Y"],["z", "Z"],[".", "/"],],// 第 4 行: (2)[["-", "_"],[",", ":"],],
];

所以, 想要修改键盘布局是很容易的.


在这里插入图片描述

拼音输入 (默认状态). 左上角的 shift 键换成了 “重输” 键, 按下会清空全部拼音.

在这里插入图片描述

拼音输入状态, 上方显示输入的拼音 (双拼) 和候选项.

在这里插入图片描述

数字键盘.

在这里插入图片描述

ASCII 符号键盘 (英文标点). 此处包含 ASCII 的全部符号 (32 个, 空格除外), 对写代码友好. 从此在手机上也能好好写代码啦 ~~

在这里插入图片描述

中文标点以及一些符号.


此处 Android 软键盘界面的设计, 主要是为了简单. 各个键盘的职责分工明确, 键盘之间的切换简单直接, 保持一致. 别的输入法各种键盘之间的复杂跳转逻辑, 窝是受不了的, 一会儿在这里点这个键, 一会儿到那里点那个键, 一会儿就绕晕了, 不知道自己在哪里 … .

3.5 GNU/Linux 应用 (ibus)

相关文章:

  • 《ibus 源代码阅读 (1)》 https://blog.csdn.net/secext2022/article/details/136099328
  • 《发布 rust 源码包 (crates.io)》 https://blog.csdn.net/secext2022/article/details/136201091

此处选择了 ibus 输入法框架.

为什么要选择 ibus 呢 ? 因为窝使用 GNOME 桌面环境, GNOME 默认集成了 ibus, 所以使用起来比较方便. 并且, 虽然 ibus 的拼音输入法 (ibus-libpinyin) 窝感觉不太好用, 但是 ibus 本身多年来还是很稳的, 基本上没出过大问题. 虽然还有 fcitx 输入法框架, 但是在 GNU/Linux 桌面环境的软件生态中, ibus 相对更普及一些. 甚至 fcitx 本身也选择了兼容 ibus.

ibus 本身使用 C 和 python 开发, 但是使用 D-Bus 协议连接各个组件. 本输入法虽然使用了 ibus 输入法框架, 但是并没有对 ibus 有代码上的直接依赖, 而是选择从 D-Bus 开始, 兼容 ibus 的协议 (艾刷 librush 模块).

在 web 运行环境的选择上, 窝喜欢 chromium 浏览器内核, 所以排除了 tauri, 选择了 electronjs. electronjs 更加成熟稳定, 有 vscode 这个大厂的产品做代表, 并且 electronjs 不用自己编译, 直接拿过来就能用, 比较方便. 在 GNU/Linux 系统上通常都有软件包管理器进行依赖管理, 这可以抵消 electronjs 的大部分缺点.

专门为 electronjs 编写的代码只有 227 行 (js).

3.6 Android 应用

相关文章:

  • 《Android 输入法框架简介》 https://blog.csdn.net/secext2022/article/details/136246340
  • 《在 Android 运行 GNU/Linux 二进制程序 (proot)》 https://blog.csdn.net/secext2022/article/details/136333781

在 Android 系统就要使用 Android 输入法框架. Android 应用是使用 Android Studio 创建的普通应用, 使用 kotlin 编程语言.

在 Android 使用 WebView 显示网页是标准操作, 也就是使用系统自带的浏览器内核 (chromium). 在国产手机 (比如 MIUI) 上即使不 root, 也可以通过安装 Android System WebView 这个 apk 来更新系统 WebView 内核.

在这里插入图片描述

注意版本号.

在 apk 中打包自带一个浏览器内核, 不是做不到, 但是太麻烦了, 并且相比系统 WebView 没有明显优点.


在 Android 运行 deno 使用了 proot. 这样可以让拼音核心运行起来.

使用 proot 并不是最好的方法, 但是可以接受, 性能并不差.

3.7 安全设计

相关文章:

  • 《高版本 Android 如何访问 sdcard/Android/data 目录中的文件 (翻译)》 https://blog.csdn.net/secext2022/article/details/136335220

此处的安全 (security), 是指信息安全, 网络安全, 黑客攻击这方面的.

事先声明, 绝对的安全是不可能实现的. 开发者能够做的, 是让一个软件合理的, 足够的安全, 不要出现严重安全漏洞而已.

在此详细描述安全方面的设计, 是为了能够公开的对其进行检查. 如果发现这里有安全漏洞, 记得联系窝哦 ~~

  • (1) 用户数据库的存储. 用户数据库保存了一部分用户输入的内容, 这部分是敏感数据, 需要重点保护.

    用户数据库使用 deno-kv, 底层对应 sqlite 数据库. https://deno.com/kv

    • 在 GNU/Linux 平台, 用户数据库文件的位置是:

      > ls -l ~/.config/pmim/pmim_user.db
      -rw-r--r-- 1 s2 s2 2977792  3320:29 /home/s2/.config/pmim/pmim_user.db
      

      这位于用户的主目录中, 而用户主目录默认的权限是 700:

      > ls -ld ~
      drwx------ 1 s2 s2 1136  34日 05:28 /home/s2/
      

      也就是说只有用户自己可以访问. 所以, 在系统环境安全 (没有别的恶意软件偷偷读取这个数据库) 的前提下, 这个数据库文件是安全的.


    • 在 Android 平台, 用户数据库文件的位置是: /sdcard/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/pmim_user.db

      这个是 Android/data/包名 目录, 只有应用自己可以访问, 别的应用无法访问. 所以, 在系统环境安全 (比如没有 root) 的前提下, 这个数据库文件是安全的.

  • (2) 拼音核心 (pmim-server) 的 HTTP 接口. 用户界面通过 HTTP 接口 (REST) 对拼音核心进行请求.

    拼音核心对 HTTP 接口 (API) 的调用使用 token 认证, 对应源代码 (pmim/server/routes/pmims_api/_middleware.ts):

    // /pmims_api/* header: x-token
    // 检查口令 (认证)
    export async function handler(req: Request,ctx: FreshContext<状态>,
    ) {// 首先尝试从 headers 中获取 tokenlet token = req.headers.get(HH_TOKEN);// 其次从 cookie 中获取 tokenif (null == token) {token = getCookies(req.headers)["x_token"];}// 检查 token 是否正确if ((null == token) || (!检查口令(token))) {return new Response("HTTP 403", {status: 403,});}return await ctx.next();
    }
    

    检查口令使用定长时间的比较函数, 这是为了对抗时间侧信道的攻击, 对应源代码 (pmim/server/pmims/auth/token.ts):

    import { timingSafeEqual } from "$std/crypto/timing_safe_equal.ts";// 内存中保存的口令
    const etc = {口令: new Uint8Array(),
    };export function 检查口令(t: string): boolean {const d = new TextEncoder().encode(t);return timingSafeEqual(d, etc.口令);
    }
    

    token 使用真随机数据生成, 对应源代码 (pmim/server/pmims/auth/token.ts):

    async function 获取随机数据(): Promise<string> {// 64 Byte, 512bit 随机数据const a = new Uint8Array(64);crypto.getRandomValues(a);// base64(sha256())const h = await crypto.subtle.digest("SHA-256", a);return encodeBase64(h);
    }export function 口令文件路径(): string {const 目录 = Deno.env.get(ENV_XDG_RUNTIME_DIR)!;return join(目录, FP_TOKEN);
    }export async function 初始化口令() {const 口令文件 = 口令文件路径();logi(" token: " + 口令文件);const 口令 = await 获取随机数据();// 存储口令etc.口令 = new TextEncoder().encode(口令);await 建上级目录(口令文件);await Deno.writeTextFile(口令文件, 口令);
    }
    

    此处使用的是 Web Crypto API https://developer.mozilla.org/en-US/docs/Web/API/Web_Crypto_API.

    同时, 拼音核心只监听 127.0.0.1 IP 地址, 这意味着只有本机的程序可以连接. 对应源代码 (pmim/server/pmims/conf.ts):

    export const 监听地址 = "127.0.0.1";
    

    源代码 (pmim/server/fresh.config.ts):

    export default function getConfig() {return defineConfig({plugins: [tailwind()],server: {port: 获取端口(),hostname: 监听地址,onListen,},});
    }
    

    • 在 GNU/Linux 平台, 口令文件的存储位置是:

      > ls -l $XDG_RUNTIME_DIR/pmim/server_token
      -rw-r--r-- 1 s2 s2 44  3322:27 /run/user/1000/pmim/server_token
      

      XDG_RUNTIME_DIR 的默认权限是 700:

      > ls -ld $XDG_RUNTIME_DIR
      drwx------ 19 s2 s2 660  34日 06:21 /run/user/1000/
      

      同样的, 只有用户自己可以访问.

      electronjs 读取口令文件的源代码是 (pmim-ibus/electronjs/main.js):

      // 读取 deno/fresh server http token
      async function read_token() {const xrd = process.env["XDG_RUNTIME_DIR"];const 口令文件 = path.join(xrd, "pmim/server_token");logi(" read token: " + 口令文件);return await readFile(口令文件, { encoding: "utf8" });
      }
      

    • 在 Android 平台, 口令文件的存储位置是: /sdcard/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/server_token

      同样的, 只有应用自己可以访问.

      WebView 中的页面读取口令文件的源代码是 (pmim-apk/p/app/src/main/java/io/github/fm_elpac/pmim_apk/im/ImView.kt):

      // 读取 pmim-server 的口令
      @JavascriptInterface
      fun pm_口令(): String {// /storage/emulated/0/Android/data/io.github.fm_elpac.pmim_apk/files/pmim/server_tokenval 外部文件目录 = p.getExternalFilesDir(null)!!val 口令文件 = File(外部文件目录, "pmim/server_token")println("ImView: 口令文件 " + 口令文件.getAbsolutePath())return 口令文件.readText()
      }
      

    上述这套机制实现了:

    • (1) 每次启动后都重新生成足够长的随机 token.
    • (2) 只有本机的应用 (127.0.0.1) 才可能请求核心的 HTTP 接口.
    • (3) (GNU/Linux) 只有用户自己的应用 (能够读取口令文件) 才可以请求核心的接口. 本机别的用户无法访问.
    • (4) (Android) 只有应用自己才可以请求核心的接口. 本机别的应用无法访问.

  • (3) 艾刷与拼音核心之间的通信 (仅适用于 GNU/Linux 平台).

    艾刷与拼音核心之间使用 UNIX socket, 对应的文件路径是:

    > ls -l $XDG_RUNTIME_DIR/pmim/us
    srwxr-xr-x 1 s2 s2 0  3322:27 /run/user/1000/pmim/us=
    

    同样的, 只有用户自己可以访问.


未来, 还可以考虑使用 deno 权限, flatpak 沙箱 (sandbox) 等安全机制, 进一步增强应用的安全性 (比如完全禁止网络访问).

3.8 输入测量

俗话说, 没有测量就没有发言权. 拼音输入法使用 web 技术 (JavaScript) 开发, 性能会不会很差 ?

拼音核心实现了对输入的简单测量功能. 本章节来回答这些问题.

输入测量功能实现了对输入字数, 候选项序号, 核心的拼音切分和拼音转汉字的响应时间等的统计. 每分钟产生一条测量数据.

测量方法, 比如拼音核心的响应时间对应源代码 (pmim-ibus/ui-vue/src/输入/输入.js):

  // 调用接口进行拼音切分async _拼音切分() {// 输入测量const d1 = new Date();const r1 = await pm_pin_yin();const d2 = new Date();this._mt_pin_yin.push(测量时间(d1, d2));// 省略// 测量时间 (Date) 返回 ms
function 测量时间(d1, d2) {return d2.getTime() - d1.getTime();
}

使用 js 内置的 Date 进行时间测量, 精度在毫秒级别.


输入测量接口的原始数据类似这样 (有省略):

> curl -H x-token:(cat /run/user/1000/pmim/server_token) -X POST http://127.0.0.1:20200/pmims_api/m -d '{"d": "2024-03-03"}' | jq '.'% Total    % Received % Xferd  Average Speed   Time    Time     Time  CurrentDload  Upload   Total   Spent    Left  Speed
100 37051  100 37032  100    19   789k    414 --:--:-- --:--:-- --:--:--  804k
{"2024-03-03": {"分钟": 144,"统计": {"c.c": 1347,"c.c/m": 1,"c.c/M": 25,"c.n": 1347,"c.n/m": 1,"c.n/M": 25,"c.t": 2498,"c.t/m": 1,"c.t/M": 48,"c.t_M": 4,"c.t_m": 1,"i.c": 256,"i.c/m": 0,"i.c/M": 24,"i.c1": 74,"i.c1/m": 0,"i.c1/M": 12,"i.c1_M": 12,"i.c1_m": 0,"i.c1_n": 1279,"i.c1_n/m": 1,"i.c1_n/M": 24,"i.c_M": 13,"i.c_m": 0,"i.cn": 182,"i.cn/m": 0,"i.cn/M": 24,"i.cn_M": 13,"i.cn_m": 0,"i.cn_n": 141,"i.cn_n/m": 2,"i.cn_n/M": 11,"i.n": 1420,"i.n/m": 1,"i.n/M": 27,"i.n_M": 3,"i.n_m": 1,"t.c": 69075,"t.c/m": 13,"t.c/M": 1631,"t.c_M": 228,"t.c_m": 4,"t.c_n": 2613,"t.c_n/m": 1,"t.c_n/M": 50,"t.p": 96648,"t.p/m": 25,"t.p/M": 2021,"t.p_M": 112,"t.p_m": 3,"t.p_n": 5092,"t.p_n/m": 2,"t.p_n/M": 96},"平均": {"c.n": 9.354166666666666,"c.c": 9.354166666666666,"c.t": 17.34722222222222,"i.n": 1.0541945063103193,"i.c": 0.18028169014084508,"i.c1": 0.05785770132916341,"i.cn": 1.2907801418439717,"t.p": 18.98036135113904,"t.c": 26.435132032146957},"数据": {"1326": {"c.c": 14,"c.n": 14,"c.t": 24,"c.t_M": 2,"c.t_m": 1,"i.c": 3,"i.c1": 0,"i.c1_M": 0,"i.c1_m": 0,"i.c1_n": 13,"i.c_M": 3,"i.c_m": 0,"i.cn": 3,"i.cn_M": 3,"i.cn_m": 0,"i.cn_n": 2,"i.n": 15,"i.n_M": 2,"i.n_m": 1,"t.c": 569,"t.c_M": 47,"t.c_m": 6,"t.c_n": 25,"t.p": 860,"t.p_M": 97,"t.p_m": 4,"t.p_n": 48},"1352": {"c.c": 2,"c.n": 2,"c.t": 2,"c.t_M": 1,"c.t_m": 1,"i.c": 0,"i.c1": 0,"i.c1_M": 0,"i.c1_m": 0,"i.c1_n": 2,"i.c_M": 0,"i.c_m": 0,"i.n": 2,"i.n_M": 1,"i.n_m": 1,"t.c": 32,"t.c_M": 21,"t.c_m": 11,"t.c_n": 2,"t.p": 129,"t.p_M": 58,"t.p_m": 11,"t.p_n": 4},

调用接口可以对某一天的测量数据进行统计. 其中 分钟 是指多少分钟内有输入, 因为每分钟产生一条测量数据, 如果这一分钟之内没有进行输入, 就没有对应的测量数据. 统计 是对一天的所有数据进行分项累计. 平均 是一天之内的平均值. 数据 就是列出所有的原始测量数据, 每分钟一条.

此处的统计分析功能很简单, 但是因为以 JSON 格式输出了原始测量数据, 可以很容易的将数据导出, 然后使用更强大的工具 (比如 python) 进行统计分析.


窝这边最近几天的输入测量数据如下表 (GNU/Linux 平台, ibus):

日期分钟字数拼音切分拼音转汉字候选项
2024-02-24119128422.738.10
2024-02-252930521.438.70.414
2024-02-264644820.733.80.121
2024-02-27112179820.133.60.264
2024-02-28236188719.526.80.112
2024-02-29228264720.124.60.075
2024-03-013016220.533.10.014
2024-03-022527318.324.50.084
2024-03-03144249819.026.50.181
2024-03-04*132233717.425.00.211

注:

  • 日期: 测量数据对应的日期 (收集全部 24 小时).

  • 分钟: 在多少分钟内有输入 (每分钟产生一条测量数据).

  • 字数: 输入的总字数.

  • 拼音切分 (ms): 核心进行一次拼音切分的平均响应时间.

  • 拼音转汉字 (ms): 核心进行一次拼音转汉字 (查询候选项) 的平均响应时间.

  • 候选项: 平均候选项序号.

    输入时选择的候选项的序号 (从 0 开始) 的平均值.

  • *: 当天的数据并不完整.


很明显, 输入测量功能是 2024-02-24 开发完成的, 所以并没有之前的数据. 这些是最近几天窝在真实使用场景之下获得的测量数据, 比如写这篇文章.

拼音切分的平均时间基本稳定在大约 20 毫秒. 拼音转汉字后来进行了一点优化, 时间有所下降, 目前稳定在大约 30 毫秒. 这个性能并不算好, 因为如果应用要达到 60fps 的帧率, 每一帧的时间只有 16.6ms.

但是这是一个可以接受的性能. 因为一般人的击键速度难以超过每秒 10 次, 所以 100ms 以内的响应时间是可以接受的. 并且这是在一个性能并不算好的硬件上获得的结果, 窝使用的是 9 年前的破旧笔记本 (CPU i5-6200U). 在更新的硬件上可能会获得更好的结果.

在这里插入图片描述

这是窝随手做的一个击键速度测试 (英文), 最高击键速度每秒 9 次, 每分钟 314 次 (平均 5.2 次/秒).


平均候选项序号, 这个最理想的情况下是 0, 意味着每次输入的候选项都是第一项. 目前这个值大约在 0.1 ~ 0.2 之间, 也就是说大部分输入 (80%) 的候选项是第一项. 这说明输入法核心的性能并不算很差.

目前使用输入法的时间并不长, 用户数据还没有足够的积累. 后续随着不断的使用, 这个值会逐渐下降的.

在这里插入图片描述

这是在一只几年前的旧手机上的运行情况, 内存和存储的占用都在可接受的范围内. 主观感受也能流畅运行.

4 总结与展望

在这里插入图片描述

图片标题: 《拼 2024: 方圆之间, 刺破命运》

本文实现了一个简单的多平台拼音输入法, 支持 GNU/Linux (ibus) 平台 (PC), 和 Android 平台 (手机). 这个输入法的完整源代码只有几千行, 开发这个输入法也只用了十几天的时间.

开发这个拼音输入法主要有两个目的:

  • (1) 自用. 目前这个拼音输入法已经覆盖了窝日常使用的所有设备, 包括一个笔记本 (ArchLinux), 以及 3 只手机 (Android 10, Android 11, Android 12). 从此, 窝就可以只使用自己的拼音输入法啦 ~

  • (2) 用于科普拼音输入法的工作原理.

本输入法基于 web 技术开发, 主要编程语言为 JavaScript, 具有低成本, 快速开发, 跨平台, 低门槛等优点. 经过实际测量, web 技术的性能并不差, 完全可以接受.

输入法需要处理用户输入的敏感数据, 在安全方面需要格外注意. 本文对本输入法的安全设计进行了详细描述.

这个输入法在技术上和功能上都十分简单 (简陋), 拼音核心只使用了最简单的查表法. 但是是可以实际使用的, 比如写这篇文章.

对穷人来说, 便宜, 能用, 就是好.

后续在技术升级方面, 计划一步到位: 使用本地运行的语言大模型.


本文使用 CC-BY-SA 4.0 许可发布.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/719540.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。

比如&#xff0c;安装ros的时候&#xff0c;用 执行&#xff1a; sudo apt install ros-melodic-desktop-full 出现如下问题&#xff1a; 如果你根据提示&#xff0c;安装ros-melodic-desktop&#xff0c;他有会说类似“E: 无法修正错误&#xff0c;因为您要求某些软件包保持…

Vue.js入门指南:简介、环境配置与Yarn创建项目

一、Vue.js简介 Vue.js&#xff0c;一个流行的JavaScript框架&#xff0c;以其直观、灵活和高效的特点&#xff0c;在前端开发者中赢得了广泛的赞誉。Vue.js的核心库专注于视图层&#xff0c;使得开发者能够构建出响应式的数据绑定和组合的视图组件。Vue.js的目标是通过尽可能简…

BUUCTF---[极客大挑战 2019]Http1

1.题目描述&#xff0c;在地址框输入下面的网址 2.来到页面&#xff0c;ctrlu查看源码&#xff0c;仔细观察会看到一个.php的跳转页面 3.点进去页面提示It doesnt come from https://Sycsecret.buuoj.cn 4.页面提示它不是来源于这个网址&#xff0c;我们需要用bp抓包对数据进行…

Web开发介绍,制作小网站流程和需要的技术【详解】

1.什么是web开发 Web&#xff1a;全球广域网&#xff0c;也称为万维网(www World Wide Web)&#xff0c;能够通过浏览器访问的网站。 所以Web开发说白了&#xff0c;就是开发网站的&#xff0c;例如网站&#xff1a;淘宝&#xff0c;京东等等 2. 网站的工作流程 1.首先我们需…

sparse transformer 常见稀疏注意力

参考&#xff1a; https://zhuanlan.zhihu.com/p/259591644 主要就是降低transformer自注意力模块的复杂度 复杂度主要就是 Q K^T影响的&#xff0c;稀疏注意力就是在Q点乘K的转置这模块做文章 下列式一些sparse transformer稀疏注意力方法 a、transformer原始的 &#xff0…

b站小土堆pytorch学习记录—— P17 土堆说卷积操作

文章目录 一、前置知识什么是卷积操作 二、代码 一、前置知识 什么是卷积操作 推荐几个高赞博客&#xff1a; 卷积最容易理解的解释 卷积神经网络&#xff08;CNN&#xff09;详细介绍及其原理详解 还有pytorch官网的动态图&#xff1a; pytorch卷积 二、代码 import t…

MyBatis源码分析之基础支持层反射

(/≧▽≦)/~┴┴ 嗨~我叫小奥 ✨✨✨ &#x1f440;&#x1f440;&#x1f440; 个人博客&#xff1a;小奥的博客 &#x1f44d;&#x1f44d;&#x1f44d;&#xff1a;个人CSDN ⭐️⭐️⭐️&#xff1a;传送门 &#x1f379; 本人24应届生一枚&#xff0c;技术和水平有限&am…

Vision Pro开发者学习路线

官方给到的Vision Pro开发者学习路线&#xff1a; 1. 学习基础知识&#xff1a; - 学习 Xcode、Swift 和 SwiftUI 的基础知识&#xff0c;包括语法、UI 设计等。 - 掌握 ARKit 和 SwiftUI 的使用&#xff0c;了解如何创建沉浸式增强现实体验。 2. 学习 3D 建模&#xf…

『Linux从入门到精通』第 ㉕ 期 - System V 共享内存

文章目录 &#x1f490;专栏导读&#x1f490;文章导读&#x1f427;共享内存原理&#x1f427;共享内存相关函数&#x1f426;key 与 shmid 区别 &#x1f427;代码实例 &#x1f490;专栏导读 &#x1f338;作者简介&#xff1a;花想云 &#xff0c;在读本科生一枚&#xff0…

YOLOv9独家原创改进|加入幽灵卷积Ghost Convolution模块,轻量化!

专栏介绍&#xff1a;YOLOv9改进系列 | 包含深度学习最新创新&#xff0c;主力高效涨点&#xff01;&#xff01;&#xff01; 一、论文摘要 由于内存和计算资源有限&#xff0c;在嵌入式设备上部署卷积神经网络是困难的。特征图中的冗余是那些成功的细胞神经网络的一个重要特征…

【网站项目】158企业人事管理系统

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

在Linux以命令行方式(静默方式/非图形化方式)安装MATLAB(正版)

1.根据教程&#xff0c;下载windows版本matlab&#xff0c;打开图形化界面&#xff0c;选择linux版本的只下载不安装 2.获取安装文件夹 3.获取许可证 4.安装 &#xff08;1&#xff09;跳过引用文章的2.2章节 &#xff08;2&#xff09;本文的安装文件夹代替引用文章的解压IS…

Java进阶(锁)——锁的升级,synchronized与lock锁区别

目录 引出Java中锁升级synchronized与lock锁区别 缓存三兄弟&#xff1a;缓存击穿、穿透、雪崩缓存击穿缓存穿透缓存雪崩 总结 引出 Java进阶&#xff08;锁&#xff09;——锁的升级&#xff0c;synchronized与lock锁区别 Java中锁升级 看一段代码&#xff1a; public class…

Fastwhisper + Pyannote 实现 ASR + 说话者识别

文章目录 前言一、faster-whisper简单介绍二、pyannote.audio介绍三、faster-whisper pyannote.audio 实现语者识别四、多说几句 前言 最近在研究ASR相关的业务&#xff0c;也是调研了不少模型&#xff0c;踩了不少坑&#xff0c;ASR这块&#xff0c;目前中文普通话效果最好的…

Scrapy与分布式开发(1.1):课程导学

Scrapy与分布式开发&#xff1a;从入门到精通&#xff0c;打造高效爬虫系统 课程大纲 在这个专栏中&#xff0c;我们将一起探索Scrapy框架的魅力&#xff0c;以及如何通过Scrapy-Redis实现分布式爬虫的开发。在本课程导学中&#xff0c;我们将为您简要介绍课程的学习目标、内容…

Verilog Coding Styles For Improved Simulation Efficiency论文学习记录

原文基于Verilog-XL仿真器&#xff0c;测试了以下几种方式对仿真效率的影响。 1. 使用 Case 语句而不是 if / else if 语句 八选一多路选择器 case 实现效率比 if / else if 提升 6% 。 2. 如果可以尽量不使用 begin end 语句 使用 begin end 的 ff 触发器比不使用 begin end …

深度相机xyz点云文件三维坐标和jpg图像文件二维坐标的相互变换函数

深度相机同时拍摄xyz点云文件和jpg图像文件。xyz文件里面包含三维坐标[x,y,z]和jpg图像文件包含二维坐标[x&#xff0c;y],但是不能直接进行变换&#xff0c;需要一定的步骤来推演。 下面函数是通过box二维框[xmin, ymin, xmax, ymax, _, _ ]去截取xyz文件中对应box里面的点云…

MyCAT学习——在openEuler22.03中安装MyCAT2(网盘下载版)

准备工作 因为MyCAT 2基于JDK 1.8开发。也需要在虚拟机中安装JDK&#xff08;JDK官网就能下载&#xff0c;我这提供一个捷径&#xff09; jdk-8u401-linux-x64.rpmhttps://pan.baidu.com/s/1ywcDsxYOmfZONpmH9oDjfw?pwdrhel下载对应的tar安装包,以及对应的jar包 安装程序包…

九州金榜|孩子厌学要怎么办?

孩子从小学到初中再到高中&#xff0c;孩子出现厌学情绪很正常&#xff0c;但是孩子出现厌学情绪后&#xff0c;就必然会影响到孩子学习成绩&#xff0c;孩子产生厌学情绪的原因有哪些呢&#xff1f;只有找准孩子厌学原因才能去帮助孩子怎样去克服孩子厌学情绪&#xff0c;下面…

day34贪心算法 part03

1005. K 次取反后最大化的数组和 简单 给你一个整数数组 nums 和一个整数 k &#xff0c;按以下方法修改该数组&#xff1a; 选择某个下标 i 并将 nums[i] 替换为 -nums[i] 。 重复这个过程恰好 k 次。可以多次选择同一个下标 i 。 以这种方式修改数组后&#xff0c;返回数…