第一篇講了用處 (Use Case) 和前景路線圖。第二和三篇講解了智能叛變和智能安全。第四篇筆者講解下,拆開智能的神祕面紗。就是從技術面和雲端並架構上,講解下智能的架構。當中並會進一步領會到其發展的可能性,和商業機遇。
模型
以現在這刻來說,模型大多都分為這些:語言、圖像、語音、影片、視力 (Computer Vision)、MLLM(Multimodal LLM,請參第一篇)等等。而一般都是在一些開源平台上發佈。
人工智能圈內的研究和開源平台,都有不少研究員或科技人士參與。筆者也有參與,也造了幾個為作講解科技範例的軟件,有在 個人用戶的 Appstore 上免費分享(連結)。
智能科研圈內都共用著不少開源的資源。例如模型一般都在 HuggingFace 和 Github 上開源分享。
模型框架
一般的模型都會運用幾個框架 (Frameworks) 之中的一個:主要是 PyTorch (by Meta) 和 TensorFlow (Google);或其他較次要的例如 CoreML (Apple)、JAX (Deepmind)、ONNX (Meta + Microsoft) 等等。PyTorch 仍是最多模型運用的框架。
模型是可以在框架間轉換的。例如若要放到 iPhone 上運作,若要運用 iPhone 的 CoreML 框架,就要從另一個框架(例如 PyTorch)轉換到 CoreML。
例如 OpenAI 開源在 huggingface 的語音智能 whisper,都是會提供 PyTorch, TensorFlow 和其他格式。也會有其他人包括筆者會嘗試將它轉換到 CoreML,為可以在 iPhone 上運作。
而模型以外的代碼,不少架構都是大同小異。而且具模組化設計 (modular design)。看得多差不多都認得來來去去那些架構。而且也可以拆開運用應付其他需要。
各個雲端平台
而通用平台上,各個雲端供應商,都已經發展出人工智能專屬的設備。只是還是初步設置,未及完善。例如 Amason AWS 上面,EC2 是有專為智能而設計的硬件配置,可以特別適切到 PyTorch 或 TensorFlow 的專屬硬件配置。AWS 也有 SageMaker 的專屬服務,專為智能的模型訓練 (Training),和部署 (Deployment) 和建設/實施 (Build / Implementation) 用的平台。
雲端 – Amazon AWS

雲端 – Google GCP
Google 在人工智能的研究 (2011) 比 OpenAI (2015.12) 還早,所以在它的雲端平台 GCP 上,是比起其他雲端平台在智能的發展上更充份。在 GCP 上面,專業用的智能平台包括 Vertex AI 和 Tensorflow / TPU;還有一大堆人工智能功能,例如電腦視覺 (Computer Vision)、語言 (Natural Language)、語音 (Speech)、文件分析、翻譯、通話機器用的 Dialogflow (Chatbot) 等等的功能平台。(下圖截自 Google GCP)

雲端 – Microsoft Azure
Microsoft 的 Azure 雲端平台,因為與 OpenAI 關係密切也有著優勢。主要平台除了 OpenAI,也有 Azure Machine Learning,用作訓練、建設和部署。(下圖截自 Azure Cloud)

WEB4 應用
近月筆者在友間也在樂趣討論和分享著不同的人工智能運用方式 (Use Case)。除了這篇分享的內容外,筆者提到現在科技圈內外的主流聲音,似乎都還是對智能能力的想像力和創意上略有不足。而在這方面,智能會漸漸擴充大家對應用科技的想法。
這概念有點像我們前幾年說 WEB3 模型。區塊鏈被設計出來後,有區塊鏈圈內的人提倡 WEB3 模型,就是用區塊鏈做一些金融以外的東西。若智能按九十年代的電腦科學界內的前輩們的分類,說是 WEB4 的話,那麼除了文本、語音、圖像、影片等等之外,大概應該還有不少 WEB4 模型。而這點的可發揮性,可能會比 WEB3 更高。因為智能本身是個比區塊鏈用途更廣的科技。
而這當中,筆者會有個思考。因為人的創作力是和腦部方式有關。而智能來自的人工智能網絡的研究 (ANN, Artificial Neural Network);而相關研究又是和人類的生物腦部結構直接相關。那麼,電腦對人類作品風品的辨識,是種對作家或畫家的腦部模式的辨識。那麼,智能應該可以對人類的思考方法,或另一個人工智能的作品,作出準確辨識。
而這些的應用,都是用同上面的框架、平台、方法上建設。
模型訓練
而筆者也提出,我們現在的模型訓練,長遠上都是會發展到用智能來訓練另一個智能。而是會將智能訓練這種功能、以致智能架構和技術,發展到超過了現在的方法。
而模型的訓練,包括 WEB4 的用途,大概都是可以用一個模型的輸出,來訓練另一個模型。只不過在同一功能上,訓練出的模型大概都不會優於本來的模型。而在這些模型訓練上,業界是已經發展出充份的量度方法,去測量模型的優劣。而且同一課題內,參與的研究人員都是有可見生態。認得出啲用戶名字,因為暫時來說生態內人數不多。