零機壹觸 #28:語音輸入:人工智能入口

1368186_627ca46224294aa50674595d97aac142_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

有朋友向筆者問起,現時很多文書工作,樽頸位都是文字輸入、記錄、搜尋消化內容等的過程,亦是不同應用端口之間的障礙,而透過「人工智能」和「自然語言處理」(Natural Language Processing),如何減少中間的屏障?今期討論一下人工智能在這方面的發展趨向。

現時電腦科技的口述自動筆錄功能已經十分成熟,只是還未算是普及。2012年,微軟便曾示範過 Microsoft Translator的功能,能夠即時口語傳譯將英文翻譯成普通話,即場測試準確度頗高。而Microsoft Translator是植入了Skype程式,亦在Android和iPhone上有App,亦有編程接口(API)對公眾開放。有興趣者可以下載軟件測試一下;不少用家覺得它的筆錄功能比Siri好,翻譯功能也比谷歌翻譯優勝。

筆錄和翻譯功能,對自然語言處理和人工智能發展而言,只屬前線功能。可以這樣理解:應用前端將人類「口語」筆錄為「文字」,之後將「文字」轉化為「概念」,而將知識整理出一個「概念網絡」,儲存為像腦地圖(Mindmap)一樣的格式。概念網絡可以記錄所有人類從太初迄今的所有知識,而優點在不需要用口語或文字儲存,而直接用方便電腦處理的方法儲存。這便是一個電腦專用的知識庫或大腦,只在有需要時才翻譯為文字或語言。而這個概念網絡或知識庫的概念,在電腦科學裏有一個完整的學術範疇稱為「知識管理」(KM, Knowledge Management)去處理和研究。

建立好知識庫之後,人工智能除了可以運用這概念庫去了解世界和人類溝通外,也可以藉概念作出「行動」。行動會製造出物流、人流或資訊流等「流動」,然後達至滿足人的「市場需求」,從而整合出一個人工智能輔助的「經濟系統」。

整合於人類經濟社會
簡而言之,即是:「文字或語言」→「概念網絡」→「物件資訊流動」→「滿足需求」→「操作經濟系統」。這便是人工智能對人類經濟社會的參與的一個整合理解。至此,這個人工智能除了自主性外,便差不多是一個完整的AGI(Artificial General Intelligence)。

現時的互聯網仍然是主要藉着語言和文字操作,所以它仍是在2.0階段。網絡3.0被稱為語義網(Semantic Web),它的主要操作語言便是上述的「概念網絡」。而構造語義網和概念網絡,需要的便是近年大熱討論的深度學習功能,例如谷歌示範過只是靠YouTube影片教曉人工智能明白「貓」的概念,和人工智能只從觀察而不靠人手輸入學懂玩卡牌遊戲,而擊敗人類玩家。概念網絡組成了人工智能最重要的大腦記憶部分後,就到物件流動和滿足需求,便輪到各種機械人科技差不多成熟登場。可能在很多人不知不覺間,科技其實一直向着學術界一早已計算的正確方向飛快地發展。

零機壹觸 #27:捕獲寵物精靈熱

mobile-20jul
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

2016年7月6日,是手機遊戲史上的新的里程碑。當日是Pokémon GO首發日,發行後24小時內,就成功攀登上Apple App Store的Free和Top Grossing排行榜的首位,也成為在App Store和Google Play史上最快登上榜首的遊戲。48小時內,它已經佔據了全美國5%的Android手機。6日後,它已達到2100萬活躍用戶,擊敗本來在榜首、紀錄為2000萬活躍用戶的Candy Crush,成為史上最多活躍用戶的遊戲。同日報告亦刊出,此遊戲的每日使用次數超過了Facebook、Twitter和Instagram,成為最常用的手機應用榜首。

任天堂的股價在此遊戲發行翌日急升10%,7日後股價到達頂峰,升值逾50%。其實任天堂在Pokémon GO的佔有份額只得三分之一,因此不少人認為升幅含有不少泡沫成分。

Pokémon GO是藉着舊有Game Boy的遊戲Pokémon(香港舊譯《寵物小精靈》,2月時日本方面統一了繁簡中文譯名為《精靈寶可夢》,引發一連串熱話)和其動漫世界所發展出的手機遊戲。遊戲利用手機的鏡頭和全球定位GPS功能,加上AR(Augmented Reality),即擴增實境技術,讓用家一嘗做訓練師的滋味。遊戲概念其實源出於谷歌在2014年設計的愚人節玩笑。谷歌製作了影片講發布軟件,帶來不少熱潮迴響,因而啟發Niantic公司開發遊戲。

Niantic以前開發過也是藉AR和GPS成功的遊戲Ingress(2012年11月),由現任執行長John Hanke創辦,本為谷歌分拆出獨立為運作遊戲而成立的公司。

日本任天堂的已故社長岩田聰也曾經支持Pokémon GO這個開發計劃。John Hanke接受訪問時提出Pokémon GO有3個目標:讓玩家出外運動;讓人用新眼光看世界;與陌生人破冰交流。

童年回憶現實遊戲化
若談科創技術分析,其實Pokémon GO的科技都不是新事。GPS、AR都是10年以上的歷史,在還未有iPhone的時代,以前諾基亞(Nokia)手機就有過包含相關功能的遊戲。而遊戲的成功在不單將遊戲世界立體化,與真實世界更多接軌;也是將人的童年幻想帶到現實,並借助積儲着大量情感回憶的既有著名品牌取得成功。過程也藉着一條爆紅的YouTube片而測試市場。

筆者意見是,除GPS和AR現在還有更多可「遊戲化」(Gamification)的周邊科技,例如今年秋天會開放開發者介面的Siri,或Apple和Facebook都有開放開發者介面的即時通訊平台。積蓄大量情感回憶的已有品牌固然是重要,而在生活中習慣觀察和加上創意聯想,也是遊戲的成功元素。

未來一年,VR和AR都會大行其道。尤其以暑假的動漫遊戲展成為本地的頭炮。VR和AR的普及會將遊戲和市民生活生態帶來改變。想了解更多的朋友,不妨到7月尾的動漫節遊覽一下。

零機壹觸 #26:真.22世紀殺人網絡

1338147_bff9a996c5737a678f65b2da71c5b157_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

人類與機械的親密關係,一直是熱門的電影題材。近日機械化人類的討論興起,源於現代科學將這幻想變成現實。機械化人類(Cyborg, cybernetic organism)一字起源於1960年,用來稱呼當年科學家想像中的一種人類,經過機械強化後,能夠在地球以外的環境中生存。6月時谷歌註冊了一項專利,是有關將一個矯正近視,並植入眼球的電子儀器。該儀器還具有自動拍攝和錄影功能,並可無線上網。這掀起了一些植入式電子和機械化人類的討論。

植入式電子儀器的例子,在近年一直屢見不鮮,並於醫療方面一直廣泛使用。典型例子是1958年已開始使用的永久性心臟起搏器,近年的研究將起搏器愈造愈小巧。美國賓夕法尼亞州醫學院的科學家亦已發明植入腦部的儀器,能記錄腦部運動,醫治脊部受傷和神經系統疾病。植入耳朵的人工耳蝸和刺激脊部使癱瘓者能再步行的科技亦已在臨床階段。近年對機械人和外骨骼(Exoskeleton)的研發,亦使電子義肢成為殘障人士的福音;外骨骼亦已用在軍事科技。亦有備受爭議的課題,例如植入電子儀器作避孕用途,藉無線控制,甚至可能影響出生孩子的性別。

機械化潮流
隨着人體從內到外——從內臟到四肢——都有科技儀器的強化,機械化人類是不可避免的可能趨勢。筆者觀察這趨勢原因有幾個:一)人工智能超越人類是遲早的事,於「未來報告」前幾篇的討論,專家一般認為是2040 年,不過種種跡象都顯示着很可能會比這早很多,而屆時人類需要保持競爭力,機械化人類是其中一個有效選擇。二)全球網絡一體化,電腦與電子工程技能普及化。三)近年電腦愈做愈小,植入儀器包含Wi-Fi無線上網已是常例。四)上述的從內到外在當下科技都已有成熟條件。

現時只有植入式輔助醫療儀器的科技陸續出現,談到機械化的潮流起始,還要至少5至10年後,這和人工智能的發展趨勢掛鈎平行。若這潮流出現,人類可能會分為機械化和非機械化族群;機械化族群具有較佳能力,亦較能與先進社會配合工作。這便會掀起機械革命,並可能有追求全天然的原始派或宗教人士社群和培育相關的黑客社群。

從人工智能的當下發展,到人類因要應對競爭的機械化可能,筆者不禁聯想起虛擬實境VR。當機械化人類用植入的儀器上網進入VR,不就是電影 《22世紀殺人網絡》(Matrix)的概念藍本嗎?

零機壹觸 #25:個人物聯網接通萬物

1328501_c47a3f69c318c6dca63d0ec7f7138e4b_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

在社會漸漸適應使用手機和平板,似乎虛擬實境VR和人工智能AI的新一浪即將來臨之時,筆者認為下一個熱潮不是VR或人工智能,而是Web 4.0。

這概念跟Steve Jobs 提過的 Post-PC Era有點像,不過更像的是上世紀學術派提出的Web 4.0 概念:「The One」。這個將會是科技界下一件大事(Next Big Thing)。

Web 4.0的原理,在於現代用家愈來愈少放時間在個人電腦,而轉向使用平板或手機取代運行他們需要的功能;或他們會用次世代遊戲機(e.g. PS4, XB1)或大型音響組合連接家用網絡;甚至將要流行的VR和人工智能,都是離開桌面電腦,或至少離開桌面顯示屏的玩法。趨勢走向物聯網系統(IoT, Internet of Things),但這不停在這裏:這些「個人物聯網」會因為人工智能、VR和社交媒體,形成一個「一體化電腦網絡」,主要是因為VR和人工智能都是主要由供應商的中央伺服器掌管。

這中央化電腦系統(Centralized Computing)趨勢中,NAS(Network Attached Storage,網絡附加儲存)很適合在這物聯網中擔任中央存儲或雲端系統的角色。

中央儲存由NAS開始
NAS是一件令生活方便的工具,也是筆者推介給香港年輕或熟練級的電腦玩家的科技。NAS的好處和用處很多,主要優點在它能在簡易的設定,可為一般家用網絡加上強大功能。最基本的設定它可以是一個中央檔案儲存,可以讓同一個區域網,例如一間公司內網絡的電腦,都能輕易存取檔案,那麼就可以省卻用USB或電郵等運送大型檔案了。而若配合了域名系統設定(DNS)和手機流動上網——NAS內一般都提供簡易設定,便可以將NAS內的中央儲存經過互聯網隨時送到手機上。這樣便可以輕易將家中大量儲存的音樂、電影,甚至書籍或文書檔案,隨時隨地經過4G網絡送到手機上。

NAS可以設定自動備份功能,或雲端硬碟備份;也可以設定RAID(獨立硬盤陣列)。RAID是將兩隻以上的硬碟連在一起使用,而可以同時設定備份,例如四隻硬碟中其中一隻是備份,若四隻中壞了任何一隻,RAID系統都可以幫你自動修復,並且還原備份。這對保存家中或公司內寶貴的資料很有用。NAS也有多用戶設定和對應手機軟件等,方便用家開放用戶給家庭使用或公司使用。

除了以上基本功能,有些品牌的NAS也有設計自己的全套系統服務。這些NAS系統可以讓用家用滑鼠點幾點,就可以安裝並運行網絡伺服器、檔案伺服器、串流平台、個人專屬的維基平台、資料庫、代碼版本控制系統(e.g. Git / Subversion)、影像監視系統、個人博客等。這些系統都是NAS供應商隨硬件付運的平台上免費提供,而且還每月不斷加入新功能中。對進階用家值得推薦。

谷歌在今年5月底的 I/O發布會中,發表了 Google Home,一個在個人物聯網系統內擔任聲控的谷歌搜尋器角色的科技,如在家中設置了 NAS,就能馬上享受這些「個人物聯網」類的新穎產品。

零機壹觸 #24:影響世界的程式碼侵權案

1320674_ba84b7b8efb1c77f37398a3544d22b1b_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

早前谷歌(Google)於Java被甲骨文公司(Oracle)控告侵權案件中勝訴,而案件還會再延伸訴訟到聯邦法庭。事緣2010年甲骨文公司認為谷歌的安卓平台(Android)使用的開發語言Java是侵權行為。Java本身是開源平台(Open Sourced),不過甲骨文針對的討論是API(程式接口,Application Programming Interface)的設計是有版權保護,而谷歌被撿查到涉嫌抄襲了九行程式碼。甲骨文因為這九行嫌疑抄襲的程式碼(附圖),索價賠償90億美元。

谷歌也不是全無預備的。Java本來屬於昇陽電腦(Sun Microsystems),之後昇陽被賣給甲骨文,連Java一併歸入甲骨文。谷歌之前和昇陽沒能達成協議,也因此決定自己以Java開源平台,創造一套合法的安卓開發平台。但甲骨文發現了以上九行程式碼被抄襲,便成了訴訟焦點。

這案件首次於2012年在加州北區地方法院審理,裁決谷歌勝訴。法官認為版權法只保護「創作」方面,而不保護「功能性內容」;因功能性內容對配合運作有必須性,例如程式接口若不統一便會使程式不能互相配合,功能不能運作。

甲骨文於是上訴。2014年聯邦巡迴上訴法院判決甲骨文勝訴。法庭認為所有程式碼都和文字一樣,都應受版權法保護。

谷歌因此向最高法院要求介入。最高法院拒絕申請;而谷歌將案例方向轉向版權法中的「合理使用」方向,而將案件提交三藩市聯邦法院審理。案件回到Alsup法官手上。早前Alsup法官判谷歌勝訴。即是谷歌是合乎「合理使用」原則。

案件會再回到聯邦巡迴上訴法院。結案陳詞中,代表谷歌的多年來對科技案件很有經驗的大狀Robert Van Nest指出,「這個裁決不單是有關谷歌和甲骨文,亦影響整個行業」。筆者講解一下這個裁決對整個行業有什麼影響?

「功能性內容」不符「合理使用」
首先,因為「功能性內容」、API設計等都不能歸算為「合理使用」(若谷歌敗訴),那麼現行的大部分程式都可能會被興訟。例如各種API接口、程式的命名、類近的功能,都不能寫得一樣。具體舉例,例如面書做一個登入API,有用戶名和密碼兩個項目;而谷歌已有另一個登入的API,也是有用戶名和密碼兩個項目,面書就要小心不能寫得一樣,否則可以涉嫌侵權。這樣,因為程式語句要寫得不同,編程工程師就要應付不同的接口,工作就會更複雜。這是一個對程式開發界別的影響。

另一方面,例如微軟辦公室軟件中有試算表(Excel)程式,而谷歌的谷歌紙(Google Sheets)也是試算表程式。那麼,谷歌紙的介面設計就要和微軟的試算表的有不同,否則微軟也可以興訟告侵權。關鍵在因為「合理使用」對一切無論程式或是用家接口都不適用,就算是必須功能只要類近都可以入案。而這個會影響所有現有的用戶程式,所以對公司及用家同樣有影響。

零機壹觸 #23:科創公司之煉成

1307553_693ba2f1967ecfefdfab41a26c4467dd_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

最近有幾個朋友詢問過筆者,有關營運科技公司的事情,在近年遍地開花、科技公司如雨後春筍,而各項科創投資、天使融資等都到處綻放的年代之下,如何開設一間屬於自己的科技公司?

從今年年頭的統計數字可見,網絡眾籌(Crowdfunding)的投資總額,已經超過天使融資(Angel Fund)的總額,而趨近創投(VC, Venture Capital),並將在今年年底或下年年初超過創投總額。似乎到處也有不少成功案例;而似乎有些成功案例甚至是仍在學中的初哥。究竟一間科創公司是如何煉成的?

曾經有研究科創公司(Tech startups)的人說,科創公司往往萌芽於不同的原因,和主要發起人是從不同的角色介入。不過最佳的發起角色和起始點,都是源於夢想或異象(Dreams & Visions)。

夢想和做夢不同的是,有實踐力的領袖,會從夢想到建構思考問題,再到誕生產品概念。產品連結商業模型,商業模型連結資源和營運,這便是一間公司基礎性的第一步。

夢想家最重要的合作夥伴,正是執行型領袖。執行型領袖沒有規定的背景,可以是技術領袖(Tech Hero),可以是用戶專家(Customer Champion),也可以是傳統執行性管理。執行型領袖的重點,是建立並運行一個強而有力的系統,支援並達成夢想家的方向;並讓夢想家可以無後顧之憂,放心翱翔發掘商機。有人說這角色必須是技術領袖,筆者從閱歷中觀察覺得不然。實際上只要有商業模型,聘請技術人是不難的事;但建立高執行力的穩固系統是比起技術更難亦是更重要的事。

以夢想作起航
本地有諗頭有社會經驗的人士,最適合是從夢想家起首:不怕從小開始——從心從夢想,理解社會需要,用心解決問題。就算再小的問題,只要解決方法夠清楚夠具體,建立出商業模型和計下算術,就可以開始第一步。人力資源可以找散工幫手,現在的市場上各種形式的聘用方式都有,而應該是在商業模型中計算好收入支出。到漸漸建造出基本可行產品(MVP, Minimum Viable Product),就可以放出市場招募用家、人力、投資者,再加入其他核心角色。

還有些細項,例如核心團隊的第三重要角色是士氣領袖;建立出初步商業模型和產品概念後,亦需要計算競爭屏障模型(Competition Barrier);技術團隊的組成,有需要留意的技巧等等。因篇幅所限筆者先按下不述。

不過筆者覺得對考慮創業的人士,最重要的心得分享,莫過於這個:創業最重要的是臨場應變。傳統管理學相信商業模型,近年已有很多人指出,因為實際環境不是實驗室,而是一個迅速改變而且有相當龐大數量的未知數和計算的環境,商業模型實際上與其說是軸心,不如說是理念。而成功攀升至生活普及應用的創業項目,都是應變速度高的團隊。

零機壹觸 #22:串流電視席捲全球

1298105_a0d4ec5863881f7425a936c33f694d69_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

根據Cisco的研究,在2015年,影片佔據了全球網絡流量六成以上,更預算在2019年,八成的網絡流量都是影片,當中還未計算點對點技術(P2P、Peer-to-Peer)的影片檔案分享。現今是影片當道的世代,傳統電視頻道流失的觀眾,都花費時間在網絡影片之上。除了傳統的影視節目,還有來自獨立製作單位和大眾自己拍攝影片,加上網絡直播視頻門檻大大降低,無論在商業或社交層面,影片製作和分享都會是未來大趨勢。

2016年,對本地電視業界最震撼的,顯然是香港首間電視台亞視停牌,新台ViuTV上場。不過,無論是TVB或是ViuTV,同樣面對國際網絡電視新貴——Netflix的挑戰。在2016年1月,Netflix正式宣布擴展服務至全球190個國家,還不用10年的時間,Netflix就成為了全球覆蓋面最闊的收費影視服務。由Netflix投資拍攝的第二季《夜魔俠》劇集,更於3月18日作全球同步首播,並設有多國語言字幕,正式開創國際網絡收費電視台的商業模式。

Netflix的收費模式跟Spotify相若,都是收取一個固定月費,片庫內的影片任睇,用戶可隨時取消合約。Netflix使用數據分析,為用戶推介影視節目,而他們發現地域對用戶偏好的節目類型影響不大,反而只根據個人喜好作分類,就算在不同的國家或地理位置,各地的觀眾口味原來相當一致。這個分析結果跟傳統以地域為界的節目製作方向大相逕庭,當中可能因為Netflix的節目現以英語為主,全球會欣賞英語節目的觀眾口味或會相若。

不過,這分析也令Netflix作出在全球製作內容的策略,在每個國家投資拍攝當地題材、當地語言的內容,並配上多語言字幕在全球分享,行政總裁Reed Hastings更對媒體表明,願意投資拍攝廣東話劇集。由於網絡影視一般不受各國家的廣播條例所限,內容尺度可以比傳統廣播更大膽,創作空間更大,相信其投資的廣東話劇集,比本地電視台的題材風格視野可更闊。隨着相類的串流影視平台漸流行,美國21世紀霍士國際頻道也計畫拍攝廣東話迷你連續劇和以香港本土為主題的劇集,由本地公司製作到賣埠至外國的舊有影視版權銷售模式也將受挑戰。

突破地域和語言界限
創作嚴肅影視作品的本地獨立製作公司,發行渠道也比以往豐富得多,只要在製作時準備多語言聲軌及字幕,至少也加上英語版本,便能輕易在國際發行,可選擇點播串流服務的 iTunes、 YouTube、Google Movie,或月費式的Netflix等。香港是國際城市,相關的版權交易和多國語言支援製作服務也有發展空間,市場或許比電子書的發展更大。

雖然網絡串流影視服務正在高速增長,是靠智能手機和平板電腦盛行所致,可是影視節目的主要受眾,仍以傳統電視機作觀賞工具。智能電視已內置或可安裝串流影視應用程式,但是使用者的體驗,並非如傳統電視般「直覺式」選台方式。新穎的智能式電視操控,如選單瀏覽介面,以至聲控搜索和手勢指令,對較年長的一群,反而是操作障礙。對於更符合真實用戶需要,而不是賣弄技術的智能電視操控設計,仍有待進步。

零機壹觸 #21:全球連線指日可待

1287478_3e9c38f076ad72471f33cfba0d941556_620
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

在機械人和虛擬現實頻繁在媒體曝光之際, 互聯網人口已突破34億,大約為人類總人口的 46%。按現在平均速度,在今年年底或 2017 年頭,會突破人類總人口的 50%。現在的科技領袖都會號召着「全球連線」的目標。

幾時達到?按現在速度,5年內連線人口會突破50億,10年內60億。最後的10億,會是連線上最難的偏遠或落後地區。而為這最後10億,現在的科技巨頭領袖,例如面書和谷歌,都已發展並公布硬件配備方案,將這最後10億人帶上網。

連線人口上升,對現在的科技巨頭,和一眾科技創投公司來說,是意味着潛在客戶上升。首先得益的固然是互聯網的基建,例如面書、谷歌、Wordpress 等等。難怪在剛過去的 4 月 12至13 日,面書的年度盛事 F8,公布未來10年計劃時, 對連線人口、賬號登入等都有重點發展。面書現時滲透率也達到互聯網人口的 50%,約16億人。

將最後10億人帶上網,谷歌開發了 Project Loon,用熱氣球提供 4G LTE 連線給偏遠地區。而面書則運用無人機提供連線。谷歌和面書的方案,都是在6萬呎高空的平流層運行,對一般飛機航行的三四萬呎高空並不構成影響。而面書在 F8 亦展示了兩個有關連線的重點分享:Terragraph 和 Project ARIES。Terragraph 是面向城市人口稠密地區,Project ARIES 是面向人口密度低,為解決連線訊號強度的方案。

平民上網裝置助扶貧
而除了連線訊號,電腦本身也很重要。雖然上月印度的超低價手機 Freedom 251 鬧成了造假(聲稱 30港元一部Andriod 手機、1.3Ghz quad core、1G記憶體),結果須要退款了事;但現在也能以100美元 一部平板、手機或電腦的價格,捐助電腦或平板去落後地區。

而在2005聯合國舉辦的世界資訊社會高峰會議中提倡後發起的「一兒童一電腦」計劃(OLPC, One Laptop Per Child),提倡以100 美元的價錢製造電腦,捐助去落後地區,藉以改善教育和社會發展。該計劃暫時雖然仍有不少不同意見或仍佔少的百分比,但這類電腦滲透發展在未來幾年會愈來愈多,主要目標為借互聯網製造普及教育達到扶貧和社會發展,最終達到全球上網。

若不計算最後10億,單以未來10年左右有八九成人類總人口會連線上網的時間表,試看看其他幾個時間表的配合:虛擬現實(VR)──3至5年內盛行;人工智能 ──3至5年內有更具體商業方案;機械人──5年;Web 3.0(如開放編程接口的網絡)── 很多發達地區已有具規模計劃,一般目標都是3至5年;Web 4.0(一體化互聯網,需要人工智能配合)── 期望是10年左右。

有說本地香港的科技發展約為全球排第25, 發展速度是全球第5;然而在 Web 3.0 開放編程接口方面,仍比一般發達地區落後,而這一點是本地提升科技研發值得投放資源的方向,也是國際普遍趨勢。

零機壹觸 #20:耳聽八方立體音場

1276704_873350fd821cdf9b36ea65c7d2e8f8a8
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

不知道你已多久沒有購買CD了?

據美國唱片業協會(RIAA)發表的2015年音樂銷售報告,串流音樂已佔美國音樂銷售收入的最大市場份額達34.3%,多於數碼下載的34%,而傳統實體唱片只有28.8%,成三分天下局面。

串流音樂平台的領導者Spotify進入美國市場還不夠5年,音樂銷售市場已天翻地覆。以無損Hi-Fi音質掛帥的Tidal串流音樂平台,一年間付費訂戶數目增長5倍。去年Apple Music正式加入競爭,Google也開展了YouTube Music服務。可以說,傳統CD唱片的銷售模式,已在倒數的階段,唯一異數是模擬制式(Analogue)的黑膠唱片,銷售數字反而節節上升。不竟CD也是數碼格式(Digital)的製品,由更方便甚至可提供更高解像度Hi-Res音質的數碼服務所取締是必然的事。

串流音樂平台所需的技術門檻不高,到現在才成為大公司支持的商業模式,全因傳統唱片公司對授權音樂至科技公司一直採取保守的態度。此刻唱片公司比以往開放,音樂資料庫龐大,而這類串流音樂平台服務如Spotify和Tidal都有開放API供第三方開發軟件或產品。對開發者和品牌而言,提供更佳的播放和欣賞體驗,就成了新的商機,例如自然語音輸入,以及將音樂跟其他應用連動等,可創出協同效應。反而香港和台灣的同類音樂平台MOOV和 KKBOX是全封閉的系統,限制了平台的發展。

個人化3D音效
一般音樂只要經立體聲輸出,便可得到最佳的享受。可是,如今正是立體畫面甚至虛擬真實影像大行其道之時,聲音輸出技術卻追不上畫面。傳統在戲院和家庭影院的多聲道環迴立體聲系統,雖然已進化至物件導向(Object-based)的系統,例如杜比全景聲(Dolby Atmos)就可營造包圍上方和四周的多角度音場,可是這類系統都是假設以一個固定的座位為中心,觀眾要坐定定欣賞,而且硬件裝置要求高,單單要在四周和天花安裝多個喇叭,已教普通人吃不消。

如何以最簡單的裝置,輸出3D音場的聲音,各大廠商依然在爭奪這市場,未有一間獨領風騷。兩大音響技術巨頭杜比和DTS,都有開發利用普通耳機輸出立體音場的技術,卻未能普及。也有初創公司Ambidio開發讓一對普通電腦喇叭也能輸出前方立體音場的技術,獲李嘉誠的私人創投注資。這類技術,最多是應付影視播放的需要。在VR虛擬真實世界,畫面會因應頭部方向變換視點,但VR的聲效製作和輸出卻未成熟,現時VR頭戴裝置都只配上一對普通的立體聲耳機,聲音的方位未必跟畫面同步。

最近在Kickstarter上出現了全球首款可以依照用家頭形和方向自行校正的3D耳機OSSIC X,內建頭部跟蹤器,即時分析數據和修正多個單元的聲音輸出,就如VR頭戴裝置般可即時變換聲音方向。在虛擬真實世界中,當畫面和聲音都是立體和同步,再結合自由的身體操控,整個人就恍如進入另一個空間,甚至忘記了真實的存在。

零機壹觸 #19:人工智能大放光芒

1266375_17a06b0f6cd01cd0fe86f56537abf952
原文刊載於有關創投與科技的信報專欄零機壹觸,在此
蒙 startupbeat 轉載全文,在此

當Google旗下DeepMind團隊,以AlphaGo人工智能戰勝職業圍棋好手之後,幾間大廠也向大眾公布人工智能發展策略,不會讓 Google獨尊。雖然人工智能研發並非新鮮事,AlphaGo卻讓「深度學習」(Deep Learning)技術由科研層面浮上大眾眼球,讓Google搶佔了人工智能的先驅優勢(First Mover Advantages),確立科技領導者的地位。

在對戰李世乭期間,AlphaGo先勝三回合,朋友都說人工智能已如此先進,本來有點心慌,但李世乭扳回一局後已釋懷,筆者認為現在才是人工智能大放光明的開始。今時今日,電腦已能與世界頂尖一級棋手對決,並以四比一大敗人類——就算勝不了,跟人類打成平手,也非常厲害,具劃時代的意義。3年之後呢?現時AlphaGo的硬體規格,在矽級電腦中也只算平平,那量子電腦呢?和好友笑談中談起,可能幾年後,世界頭10名的都不是人類。

Google取得利益後,幾間大廠會相繼加入戰陣。然後就很可能會發生代表不同廠方的「A.I. vs A.I.」的圍棋盛事。

極速對戰能人所不能
若是人工智能對決,就不是五盤三勝制了。打趣地說,若雙方運算實力都是極度最大化的話, 兩邊伺服器同時開展一億條執行緒,每4小時一局,下夠100億局決勝負,半個月捉得完。感覺就很像《龍珠》中,天下第一武鬥會的人類冠軍撒旦先生,望着天上兩個超級撒亞人空中決鬥一樣。超人對超人,人類完全沾不上邊。更視覺化的表現,就是《廿二世紀殺人網路3:驚變世紀》中,Neo和 Agent Smith 在雨中的大戰。

其實以圍棋鍛煉人工智能已有相當歷史,現時世界上在最大的圍棋開放網絡平台Kiseido Go Server上,也接受人工智能向其他棋手挑戰, AlphaGo也曾學習KGS上的棋局。而到幾間大廠也穩健穩定,圍棋人工智能可能會成為公開鍛煉的人工智能平台。這應不會在短期內面世,因為名譽值錢,要技術穩定才有可能。就如Gmail,已成為Google的恒常服務之一。未來圍棋人工智能平台,可隨時接受人類的挑戰,或給工程師編寫人工智能演算法挑戰。一旦有了鍛煉平台,人工智能的發展就更一日千里,而各種Hackathon比賽、創投資金、新型硬體如量子電腦等將更上層樓。「強人工智能」(AGI, Artificial General Intelligence)很可能不需要2040年就已面世。嚴格說AGI的最後陣地,只欠「自我編程」功能而已。補充一點,自我編程這概念,早於五十年代已有,當時發明了著名的LISP語言專攻這領域。LISP是人類史上第二古老的第三代電腦語言;第三代電腦語言即高階語言,接近人類語言和大規模自動化。可惜當時其他硬件技術等配套,對人工智能的處理能力仍不足。

現在一切準備就緒,除Google外,Microsoft 已宣布利用Minecraft遊戲平台來訓練人工智能, Facebook透過人工智能分析衞星俯瞰圖以繪製世界人口地圖、IBM的Watson人工智能應用已進駐商業機構、Amazon正不斷推出家用人工智能產品,大家即將親身經歷科技改變世界的世代。