AI 范兒 · 產(chǎn)品拆解
語音輸入用過一兩次就放棄了?
不是你的問題,是工具還沒到那一步。
你有沒有試過用語音打字,說完一段話,看著屏幕愣了一會兒。
因為文字是對的,但邏輯是亂的。你說話跳來跳去,輸入法老老實實都給你記下來了。
比如最近我有一個想做自媒體的朋友找我聊,我隨口說了自己的想法。思維跳來跳去,沒有事先整理。
我用微信的語音輸入法,說完是這樣的:
![]()
坦率說,看到這一堆文字我頭都大了。我去整理花的時間,還不如我一開始就用文字來弄。
而且我自己還能整理,如果是發(fā)給別人(比如助理),那真的會讓人崩潰吧。
但實際情況就是這樣,我們說話不可能跟寫文章一樣,邏輯那么清晰,而且完全沒有廢話。
這就是為什么很多人,可能跟我一樣,用過一兩次語音輸入之后,就再也不想碰了。
但這兩天豆包上線了個豆包語音輸入法。
01豆包輸入法,先認識一下
玩過豆包的人應該都對它的語音識別能力嘆為觀止,比如跟老羅對話完全不帶輸?shù)模€能識別各種方言。
豆包輸入法其實上線好幾個月了,這兩天增加了語音輸入功能,官方的定位是"豆包同款語音輸入"。
把做豆包 AI 時積累的那套語音模型,直接嫁接進了輸入法里,這讓我充滿了想象和期待。
第一次打開會有點意外。界面非常干凈,沒有皮膚商城,沒有彈窗廣告,沒有會員推廣。
![]()
風格和 iOS 自帶以及微信輸入法接近,換過去幾乎沒有學習成本。
用過某些輸入法的人懂那種"打個字先跳過廣告"的煩躁感。豆包沒有這個問題。
02回到那個案例,豆包會怎樣?
我很急迫的想知道,同樣是前面這個例子,豆包語音輸入法會輸出什么。
豆包的語音輸入法跟其他的類似,會邊說邊轉文字,就像同聲傳譯一樣。
這個輸入法最終的輸出是這樣的:
![]()
說實話,看完我氣都喘不過來。
但你不得不說,它記錄的內容比微信輸入法是多多了,識別率確實高了很多。
它甚至像個勞模,一字一句完全都記錄下來了。
但你注意到?jīng)]有,豆包的輸出雖然準確,口水詞還在,邏輯還是亂的。
密密麻麻,再次讓人頭大。甚至還有錯別字,Agent 被識別成了 AIG。
這段話你能直接發(fā)出去嗎?還是不行。
你還是要坐下來重新整理一遍,把核心觀點提煉出來,把跳躍的思路理順。
這件事,豆包沒有幫你做。
一兩句話可能無所謂,但有時候我們需要很長的對話,這種情況下那就真的讓人頭大了。
難道就沒有一款真正好用的語音輸入法嗎?在回答這個問題之前,我們先聊另外一個話題。
03我們到底想要什么?
對于一個語音輸入法,我們到底期待的是什么?
是期待它能把語音完全精準、一字不落地轉成文字嗎?就算你說方言,它也能精準轉寫?
我以前也以為,能做到這點,就已經(jīng)是非常好的語音輸入法了。
直到我遇到了另一款工具,我才明白:我們要的其實一直都不是精準的語音轉文字。
我們要的是:真正能聽懂人話、并說人話的工具。
哪怕你說得再怎么前言不搭后語、邏輯跳躍,它也能三言兩語幫你把邏輯整理得一清二楚。
04Typeless 是什么感覺
Typeless 是一款讓人用了就完全丟不掉的工具,它就是那樣的產(chǎn)品,而且它還不止是那樣的產(chǎn)品。
第一次用的時候,我的感受是:原來還能這樣。
Typeless 跟其他語音輸入法不一樣,它不是邊說邊把語音轉成文字(比如豆包、微信輸入法)。
它會等到你把所有的話說完之后,經(jīng)過快速整理再發(fā)出來。
還是同樣那段亂說,Typeless 的輸出是這樣的:
![]()
這個輸出簡直絕了吧,一下子舒服了。
同樣的一段話,它幫你記錄了下來,理順了邏輯、刪除了廢話,輸出的是完全可以直接用的段落。(這個截圖里面的文字以及格式我一點也沒改)
它還有很多非常實用的細節(jié),比如你說"明天上午十點,不對,下午三點開會",它輸出"明天下午三點開會",不記錄你的糾錯過程,只給你最終結果。
它做的遠遠不只是識別更精準,而是真正聽懂了你的意圖。說完不需要再整理。
坦率說,我現(xiàn)在最爽的就是用 Claude,配上 Typeless。
我絮絮叨叨的說完一大堆的需求,Typeless 瞬間幫我理清了思路,發(fā)給 Claude 執(zhí)行。
05它還不只是輸入法
除了整理邏輯這件核心的事,Typeless 還有兩個功能,讓我覺得它的定位已經(jīng)超出了"輸入法"的范疇。
功能一
語音翻譯
你說中文,它直接輸出英文,或者其他任何語言。不是先轉成中文再翻譯,而是說完直接給你目標語言的版本。
更厲害的是,選中屏幕上一段已有文字,按快捷鍵說"翻譯成英文",它就地替換。不需要打開翻譯軟件,不需要復制粘貼,不需要切換窗口。
功能二
?? 語音改寫
選中一段文字,按快捷鍵,然后說"改得更正式一點",或者"把這段重新寫得更簡潔",它直接原地替換。
你的聲音變成了一個可以操控文字的指令,在你正在用的任何軟件里直接生效。
這兩個功能合在一起,意味著 Typeless 不只能幫你"輸入",還能幫你"編輯"。
06字節(jié)進場,會怎樣?
說到這里,我反而多了一種擔心,主要是對 Typeless 這類獨立工具而言。
字節(jié)做豆包輸入法,目前還停留在識別層,確實不是最理想的。
但以它的模型能力,往"理解意圖"這個方向走,只是時間問題。
字節(jié)做產(chǎn)品有一個慣例:先占住入口,積累用戶,然后快速加功能。豆包輸入法現(xiàn)在的動作,很像是在打地基。
一旦它開始在語音輸入里加入意圖理解、邏輯整理、語音改寫這些能力,而且免費打包在一個人人都裝著的輸入法里,Typeless 這種每月要收費的獨立工具,生存空間會變得很窄。
這種事在 AI 這個領域,已經(jīng)發(fā)生過很多次了。一個獨立產(chǎn)品做出了真正有價值的東西,大廠跟進,免費,然后原來的市場基本消失。
所以:如果你現(xiàn)在有興趣試 Typeless,我建議認真試一下。
https://www.typeless.com/downloads
趁它還是市場上體驗最好的那個,等字節(jié)追上來,這個窗口就關了。
語音輸入法真正的上限,
不是說得多準,
是說完之后還要不要再整理。從"聽寫員"到"理解者",這是下一關。
豆包輸入法值得換過來用,識別夠用,界面干凈,免費。
但語音輸入法真正的上限,不是說得多準,是說完之后還要不要再整理。這一關,豆包還沒過。Typeless 過了。字節(jié)的眼睛,肯定已經(jīng)看著那扇門了。
你用過語音輸入嗎?說完還得整理,是不是很抓狂?評論區(qū)聊聊你現(xiàn)在用什么輸入法,夠用嗎覺得有用 → 點個??在看轉給還不知道的朋友點個贊 告訴我你看完了關注「AI范兒」,下次更新第一時間收到
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.