分享有關人工智能 (4/5)：智能架構

第一篇講了用處 (Use Case) 和前景路線圖。第二和三篇講解了智能叛變和智能安全。第四篇筆者講解下，拆開智能的神祕面紗。就是從技術面和雲端並架構上，講解下智能的架構。當中並會進一步領會到其發展的可能性，和商業機遇。

模型

以現在這刻來說，模型大多都分為這些：語言、圖像、語音、影片、視力 (Computer Vision)、MLLM（Multimodal LLM，請參第一篇）等等。而一般都是在一些開源平台上發佈。

人工智能圈內的研究和開源平台，都有不少研究員或科技人士參與。筆者也有參與，也造了幾個為作講解科技範例的軟件，有在個人用戶的 Appstore 上免費分享（連結）。

智能科研圈內都共用著不少開源的資源。例如模型一般都在 HuggingFace 和 Github 上開源分享。

模型框架

一般的模型都會運用幾個框架 (Frameworks) 之中的一個：主要是 PyTorch (by Meta) 和 TensorFlow (Google)；或其他較次要的例如 CoreML (Apple)、JAX (Deepmind)、ONNX (Meta + Microsoft) 等等。PyTorch 仍是最多模型運用的框架。

模型是可以在框架間轉換的。例如若要放到 iPhone 上運作，若要運用 iPhone 的 CoreML 框架，就要從另一個框架（例如 PyTorch）轉換到 CoreML。

例如 OpenAI 開源在 huggingface 的語音智能 whisper，都是會提供 PyTorch, TensorFlow 和其他格式。也會有其他人包括筆者會嘗試將它轉換到 CoreML，為可以在 iPhone 上運作。

而模型以外的代碼，不少架構都是大同小異。而且具模組化設計 (modular design)。看得多差不多都認得來來去去那些架構。而且也可以拆開運用應付其他需要。

各個雲端平台

而通用平台上，各個雲端供應商，都已經發展出人工智能專屬的設備。只是還是初步設置，未及完善。例如 Amason AWS 上面，EC2 是有專為智能而設計的硬件配置，可以特別適切到 PyTorch 或 TensorFlow 的專屬硬件配置。AWS 也有 SageMaker 的專屬服務，專為智能的模型訓練 (Training)，和部署 (Deployment) 和建設/實施 (Build / Implementation) 用的平台。

雲端 – Amazon AWS

雲端 – Google GCP

Google 在人工智能的研究 (2011) 比 OpenAI (2015.12) 還早，所以在它的雲端平台 GCP 上，是比起其他雲端平台在智能的發展上更充份。在 GCP 上面，專業用的智能平台包括 Vertex AI 和 Tensorflow / TPU；還有一大堆人工智能功能，例如電腦視覺 (Computer Vision)、語言 (Natural Language)、語音 (Speech)、文件分析、翻譯、通話機器用的 Dialogflow (Chatbot) 等等的功能平台。（下圖截自 Google GCP）

雲端 – Microsoft Azure

Microsoft 的 Azure 雲端平台，因為與 OpenAI 關係密切也有著優勢。主要平台除了 OpenAI，也有 Azure Machine Learning，用作訓練、建設和部署。（下圖截自 Azure Cloud）

WEB4 應用

近月筆者在友間也在樂趣討論和分享著不同的人工智能運用方式 (Use Case)。除了這篇分享的內容外，筆者提到現在科技圈內外的主流聲音，似乎都還是對智能能力的想像力和創意上略有不足。而在這方面，智能會漸漸擴充大家對應用科技的想法。

這概念有點像我們前幾年說 WEB3 模型。區塊鏈被設計出來後，有區塊鏈圈內的人提倡 WEB3 模型，就是用區塊鏈做一些金融以外的東西。若智能按九十年代的電腦科學界內的前輩們的分類，說是 WEB4 的話，那麼除了文本、語音、圖像、影片等等之外，大概應該還有不少 WEB4 模型。而這點的可發揮性，可能會比 WEB3 更高。因為智能本身是個比區塊鏈用途更廣的科技。

而這當中，筆者會有個思考。因為人的創作力是和腦部方式有關。而智能來自的人工智能網絡的研究 (ANN, Artificial Neural Network)；而相關研究又是和人類的生物腦部結構直接相關。那麼，電腦對人類作品風品的辨識，是種對作家或畫家的腦部模式的辨識。那麼，智能應該可以對人類的思考方法，或另一個人工智能的作品，作出準確辨識。

而這些的應用，都是用同上面的框架、平台、方法上建設。

模型訓練

而筆者也提出，我們現在的模型訓練，長遠上都是會發展到用智能來訓練另一個智能。而是會將智能訓練這種功能、以致智能架構和技術，發展到超過了現在的方法。

而模型的訓練，包括 WEB4 的用途，大概都是可以用一個模型的輸出，來訓練另一個模型。只不過在同一功能上，訓練出的模型大概都不會優於本來的模型。而在這些模型訓練上，業界是已經發展出充份的量度方法，去測量模型的優劣。而且同一課題內，參與的研究人員都是有可見生態。認得出啲用戶名字，因為暫時來說生態內人數不多。