48. Kerning Panic·字谈字串(五)规范化有四样形式,你知道么?

内核恐慌

今日「字谈字串」,谈谈如何判断两个 Unicode 字串是否等价,以及其中必不可少的流程——规范化(normalization)。 参考链接 * Type is Beautiful 十周年专页 * TypeSchool 中文设计课,8 月 4 至 9 日将在北京开办;8 月 1 日前可报名 * 京都汉字博物馆内展出的一台日文打字机 * IBM Selectric 打字机,以 typeball(字球)结构实现字体的存放和打印 * Courier) 字体,用于 IBM Selectric 打字机 * 7 月 17 日是「世界 Emoji 日」,Apple 在今年当日分享了即将发布的新 emoji 设计 * AssignPhoneticName.py,江疆编写的 Python 脚本,可为 Mac 通讯录的中文姓名自动加注汉语拼音 * Unicode 标准 2.12 节,叙述了等价序列(equivalent sequences)及规范化(normalization)的相关概念;另有 FAQ 可供参考 * UAX #15: Unicode Normalization Forms * Unicode Normalization Charts * APFS (Apple File System),Apple 推出的新文件系统;另有 FAQ 可供参考 * HFS+,Apple 开发的文件系统 * Idempotence(冪等性) * Hash map(哈希映射) * macOS High Sierra,下一代 Mac 操作系统,将搭载 APFS * IDN(Internationalized Domain Dame,国际化域名) * Punycode * W3C 关于 normalization 的规范可参考工作草案 Character Model for the World Wide Web: String Matching and Searching;另有一则 Q&A 可供参考 * 《字谈字畅》第十二轮抽奖结果 人物简介 * Rio:IPN 联合创始人,Apple4us 程序员,《IT 公论》《疯投圈》及《内核恐慌》主播 * 吴涛:Type is Beautiful 程序员,《内核恐慌》主播 * Eric:字体排印研究者,译者,Type is Beautiful 编辑 * 蒸鱼:设计师,Type is Beautiful 编辑

129分钟
99+
8年前

46. Kerning Panic·字谈字串(四)峰回路转换行来↵

内核恐慌

CR, LF, CRLF 参考链接 * 2007 年 4 月 4 日,Rex 发布了 Type is Beautiful 现存最早的公开文章 * “Power of Emoji”,Mariko Kosaka 在 ffconf 2016 上的演讲 * 小狼毫,中州韵输入法(RIME)的 Windows 版 * Unicode Emoji 总表 5.0 版 * 所指和能指(signified & signifier) * L. A. Gatys, A. S. Ecker, & M. Bethge. “A neural algorithm of artistic style”. 2 September 2015 (last revised). arXiv:1508.06576(关于美术作品风格转移的研究) * 将 Gatys、Ecker、Bethge 等人的研究成果运用到油画作品上的实验;GitHub 上另有一个风格转移算法的具体实现,可供参考 * Erik Bernhardsson 基于五万个字体训练了一组神经网络,可用于生成新的字体 * Z. Lian, B. Zhao, & J. Xiao. “Automatic generation of large-scale handwriting fonts via style learning”. SIGGRAPH Asia 2016, Article No. 12, Technical Briefs, December 2016(基于风格学习生成中文手写字体的研究) * 大芬村 * Android O * 打字机(typewriter) * 中文打字机(Chinese typewriter) * 电传打字机(teletypewriter) * 回车(carriage return) * 换行(line feed) * 德文键盘上,Home 键标为 Pos1 (Position eins) * 确认键(Enter),及其与 Return 的区别 * 换行操作在不同环境中的控制符表示,以及 CR+LF 控制符顺序的历史原因 * 软回车和硬回车(soft return & hard return),「软回车↩︎」在部分文字处理软件中也被称作「强制换行」 * HTML 元素 * 分段符(pilcrow, ¶) * Git 可配置纯文本文件的换行控制符风格及自动转换等 * 早期版本的 Windows 记事本(Notepad),存在换行控制符的问题 * CotEditor,macOS 平台上开源的纯文本编辑器 * TextEdit+,Mac OS X 原生 TextEdit(文本编辑)的增强版,江疆(jjgod)开发 * SFTP、FTPS 和 SCP 主播 * Rio:IPN 联合创始人,Apple4us 程序员,《IT 公论》《疯投圈》及《内核恐慌》主播 * 吴涛:Type is Beautiful 程序员,《内核恐慌》主播 * Eric:字体排印研究者,译者,Type is Beautiful 编辑 * 蒸鱼:设计师,Type is Beautiful 编辑

101分钟
99+
8年前

45. Kerning Panic·字谈字串(三)🎙😂🤓🤑😌

内核恐慌

本日四方会谈,聚焦全球性政治议题:绘文字。 距离上一个世界绘文字日,已经过去 135 天。立足当下,我们将以语言的、文字的、历史的、文化的、设计的、技术的等多方面视角,不中立、不全面、不深刻地闲聊绘文字。 参考链接 * CotEditor,macOS 上的一款纯文本编辑器 * U+FFFD (Replacement Character),UTF-8 编码为「0xEF 0xBF 0xBD」,以国标码解码可能形成「锟 (0xEFBF) 斤 (0xBDEF) 拷 (0xBFBD)」 * 南極星(NJStar Software) * Shift JIS * U+FEFF (Zero Width No-Break Space, BOM),UTF-8 编码为「0xEF 0xBB 0xBF」,以国标码解码可能形成「锘 (0xEFBB)」 * Guillemet,法语书写系统中使用的引号 * World Emoji Day,每年 7 月 17 日 * Emoji(絵文字) * Unicode 关于 emoji 的定义及相关释疑 * NTT DoCoMo 最初发布的 176 个 emoji,已被 MoMA 纳入馆藏 * 栗田穣崇(Shigetaka Kurita),NTT DoCoMo 初版 emoji 的开发者 * Emoticon(颜文字) * Dingbat * Pictogram(象形文字 / 图形文字) * Egyptian hieroglyphs(圣书体) * i-mode,NTT DoCoMo 架设的移动互联网服务 * Pidgin language(混杂语) * Unicode 现行 emoji 排序法(v4.0) * 艸(cǎo),《康熙字典》艸部部首 * Unicode 完整 emoji 列表(v4.0)及近期新增一览(v4.0) * Santa Claus * Emojipedia,Jeremy Burge 于 2013 年创办 * Matt Sephton 基于 Emojipedia 的数据开发了一部电子词典,可在 macOS 中使用 * Colin M. Ford 在 Medium 上撰文介绍 emoji 字体的常见格式及相关技术信息 * Google/FreeType 基于 OpenType 的 CBDT 和 CBLC 表实现 * Apple 基于 TrueType 的私有扩展 sbix 表实现 * Microsoft 基于 OpenType 的 COLR 和 CPAL 表实现 * Adobe/Firefox 基于 OpenType 的 SVG 表实现 * Adobe 基于 OpenType-SVG 开发的彩色字体,Photoshop CC 2017 已经支持 * Twemoji,Twitter 开发的 emoji,可在 web 上跨平台使用 * Emoji 标准化工作曾在 Unicode Consortium 内部引发较大争议 * Unicode 定义的 emoji 序列(v4.0)及 emoji ZWJ 序列(v4.0) * ZWJ (U+200D, Zero-Width Joiner) ,可用于拼接特殊的 emoji 序列 * IPN 旗下电台 logo 一览 主播 * Rio:IPN 联合创始人,Apple4us 程序员,《IT 公论》《疯投圈》及《内核恐慌》主播 * 吴涛:Type is Beautiful 程序员,《内核恐慌》主播 * Eric:字体排印研究者,译者,Type is Beautiful 编辑 * 蒸鱼:设计师,Type is Beautiful 编辑

118分钟
99+
8年前

42. Kerning Panic·字谈字串(二)

内核恐慌

本期 123 分钟,我们着眼汉字,回望字符集发展简史,一览常见遗留编码,笑看端序内战风云,携手拥抱 Unicode。 参考链接 * 「纽伦堡内麦塔狐」,典出《字谈字畅》第二十三期 * 曲(qū/qǔ),麯 / 麴 (qū) * 区位码)的「区位」即「row-cell」,日语称「区点」 * Ten key * 算术基本定理 * 各国读写电话号码的习惯;另有 ITU-T 起草的推荐规范 E.123,包含国际电话号码的注记格式 * 电话编号规划 * TeX 指令通常以反斜杠(\)开头 * 各书写系统中的引号 * 「乱码」在几种外语里的表述: * 文字化け(日语) * Mojibake(英语,音译自日语) * Zeichensalat(德语,直译即「符号沙拉」) * Emoji(音译自日语「絵文字」) * ASCII(美国信息交换标准代码) * JIS X 0201,七位及八位信息交换用编码字符集;前身为制定于 1969 年的 JIS C 6220,是日本最早的编码字符集规范 * JIS X 0208,七位及八位双字节信息交换用汉字编码字符集 * 언문(諺文) / 한글(韩字) / 조선글(朝鲜字),英语通称 Hangul * 半角片假名 * 编码,《内核恐慌》第十八期 * GB 2312,信息交换用汉字编码字符集·基本集 * GBK,汉字内码扩展规范;Windows 系统的代码页 CP936 是它的一个实现 * GB 18030,信息技术——中文编码字符集 * GB 12345,信息交换用汉字编码字符集·辅助集 * 单射 * 「干 / 乾」这对字具有「一繁对多简」和「一简对多繁」的双重属性 * 新加坡汉字 / 新马简体 * Big5(大五码),港澳台较常用的编码及字符集标准 * Code page(代码页) * Unicode * Unicode BMP(Basic Multilingual Plane,基本多语言平面)#Basic_Multilingual_Plane),GB 13000.1 与 Unicode BMP 的相关标准基本等同 * Unicode 定义的 script) * 中日韩统一表意符号(CJK Unified Ideographs) * 芸(U+82B8),同时为中文「蕓」、日文「藝」的简化字 * KS X 1001,韩国编码字符集标准,前身为 KS C 5601;对同形异音的汉字进行重复编码 * 日本的「中国地方」 * 「支那」源自梵文 चीन (cīna)) * Ken Lunde. CJKV Information Processing, 2nd Edition. O’Reilly Media, 2009 * 当下 Unicode 最常用的三种编码格式: * UTF-8 * UTF-16 * UTF-32 * Rio 撰于 2012 年的 Unicode 编码相关知识的笔记 * Surrogate pair,用于 UTF-16,借以扩展可编码字符集的范围 * Endianness(端序),该术语典出《格列佛游记》小人国内的两个教派 * BOM(byte order mark,字节顺序标记),对应的字符是 U+FEFF (Zero Width No-break Space) * (U+1F574, Man in Business Suit Levitating) 主播 * Rio:IPN 联合创始人,Apple4us 程序员,《IT 公论》《疯投圈》及《内核恐慌》主播 * 吴涛:Type is Beautiful 程序员,《内核恐慌》主播 * Eric:字体排印研究者,译者,Type is Beautiful 编辑 * 蒸鱼:设计师,Type is Beautiful 编辑

122分钟
99+
9年前

39. Kerning Panic · 字谈字串(一)

内核恐慌

本期是与 Typeisbeautiful.com 的 podcast《字谈字畅》的联合节目,大致介绍了从用户按下键盘到屏幕上显示出文字的过程,为后续节目提纲挈领。 相关链接 * 美茵河畔法兰克福(Frankfurt am Main),德国西部黑森州法兰克福的全称,区别于东部奥得河畔法兰克福(Frankfurt an der Oder) * 吴涛、Eric 合译《字体故事:西文字体的美丽传奇》 * 编码,《内核恐慌》第 18 期 * 键盘恐慌,《内核恐慌》第 2 期 * ANSI 键盘布局、ISO 键盘布局以及 JIS 键盘布局 * ASCII * 五笔字形输入法键位 * HHKB (Happy Hacking Keyboard) * QWERTY 和 Dvorak(德沃夏克)键盘布局 * 键盘扫描码(keyboard scancodes) * PS/2 接口 * USB Human Interface Devices (HID) * 沢尻エリカ(ERIKA),日本艺人,中文名依本人意愿写作「泽尻英龙华」 * Big5,港澳台较常用的编码 * HKSCS(Hong Kong Supplementary Character Set,香港增补字符集)、MAC(Macao Information System Character Set,澳门资讯系统字集) * 区位码)、中文电报码和四角号码 * Code page * BOM (byte order mark) * 强(U+5F3A)、強(U+5F37) * 絵文字(emoji)、顔文字(emoticon) * ASCII art * Fixedsys,微软开发的等宽点阵字体 * MingLiU,微软开发的繁体中文明体 * Hinting(渲染提示),anti-aliasing(抗混叠 / 抗锯齿) * ClearType * DPI (dots per inch) * TrueType 和 OpenType * Adobe PostScript 字体类型 Type 1 和 Type 3 * Apple Advanced Typography * 全角和半角 * ATM (Adobe Type Manager) 登场人物 * Rio:《IT 公论》主播,IPN 联合创始人,Apple4us 程序员。 * 吴涛:Type is Beautiful程序员,《内核恐慌》主播。 * Eric:字体排印研究者,译者,Type is Beautiful 编辑 * 蒸鱼:设计师,Type is Beautiful 编辑

130分钟
99+
9年前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧