文章主题:部署, Hugging Face, 地址, 永久地址
“分享一个简单的部署 ChatGLM2-6B 模型到 Huggingface Space 在线空间的方法。”
01
—
在这篇文章:终于部署成功!GPU 云环境搭建 ChatGLM2-6B 坎坷路中,用线上云算力的资源部署了一套 ChatGLM2-6B,最后显示一行提示:
“This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)”
这个地址仅有效72小时,若要获取永久地址,必须执行gradio deploy命令,将其部署至huggingface的服务器中。
开一个命令终端,试试部署到 Huggingface。
提示需要登录到 huggingface_hub 的 token。
打开 Hugging Face 网站,点击个人账户的设置部分(Profile)。
找到左边菜单中的“Access Tokens”,然后点击 “New token”。
截图中我的账号已经创建了好一个 token,见:没有硬件资源?免费使用Colab搭建你自己的Stable Diffiusion在线模型!保姆级教程,这次直接复制使用。
粘贴 token 到终端窗口,对询问“Add token as git credential? (Y/n)” 回复:“Y”,等了一会儿,给了我一闷棍:
别看满屏幕的字,有用的信息就两个:“Connection aborted.”,“Connection reset by peer”。
联想到之前部署的时候,帮助文档里 Huggingface 赫然在列:
估计是无法直接连接了,怎么办?
02
—
想了半天,打开我的腾讯云账号,一咬牙,一跺脚,买了一个月的硅谷云服务器。
终端登录,git 克隆 ChatGLM2-2B 仓库,然后执行 gradio deploy 命令。
出乎我的意外,居然也是同样的连接错误。看来虽然服务器地址不一样,还是执行了同样的网络策略。哭!
部署看起来简单,虽然只有一行命令,但是因为网络的连接问题,进展陷入了死胡同。
问问 ChatGLM,有没有什么好的解决方案。
看起来正确,感觉 ChatGLM2-6B 还真是不弱。国产之光,ChatGPT 国内产品的平替真不是白叫的。感兴趣的朋友,可以看 ChatGLM2-6B 初体验。
最后想到,既然是执行发布命令,连接到 Huggingface Space 空间去操作,其实把仓库克隆到本地电脑(有代理),再执行发布命令,是不是一样可行?
这个方案成功了,命令行下执行完 git 克隆命令,输入 token 之后,顺利进入下一步。部署命令 “gradio deploy” 会在 Huggingface 上创建一个你的仓库空间:
在苹果设备上创建一个新的Spaces Repo存储库,其路径位于用户目录下的Documents文件夹内,具体位置为/Users/huangyong/Documents/ChatGLM2-6B。
请记住,在回答后续问题时,除了硬件配置以外,其他都可以回车采用默认值。
在硬件领域,我们提供丰富的选择,包括CPU基础版(cpu-basic)、CPU升级版(cpu-upgrade)、T4小型版(t4-small)、T4中型版(t4-medium)、A10G小型版(a10g-small)、A10G大型版(a10g-large)以及A100大型版(a100-large)。对于CPU基础版,它提供了稳定且高效的性能,是各类应用的理想之选。
这个地方输入:t4-medium,才能让 ChatGLM2-6B 跑起来。
在查阅ChatGLM-6B的官方文档时,我注意到其中提到了一些有关量化模型的设置。根据这些信息,似乎有可能通过优化配置让较少的硬件资源得以运行。然而,具体细节方面我并未投入足够的精力去深入研究。
第一次运行的时候,就按了回车,选择默认 cpu-basic 硬件配置,就没运行起来。
如果直接输入:t4-medium,会提示需要添加一个付款方式:You must add a payment method to your account 。
当时我没关注这条提示信息,直接用基本配置 cpu-basic 部署,结果就是失败。
RuntimeError:Found no NVIDIA driver。
如果硬件配置选择 t4-small,会卡在第5个 Checkpoint。
没有任何错误提示,也是卡这里郁闷了很久。也不报错,最后猜测是不是硬件资源里面内存不够,把空间升级到 medium,就能顺利运行起来了。
启动后,点右上角:“App”。
Huggingface Space 提供一个永久的空间地址供访问:
作为一位专业的文章写作高手,我将重新组织原文内容并赋予其新的生命。原文链接为:https://huggingface.co/spaces/foghuang/ChatGLM2-6B。ChatGLM2-6B 是一个基于语言模型的人工智能助手,由清华大学 KEG 实验室与智谱 AI 公司于 2023 年共同训练推出。该助手具备良好的中文理解能力和生成能力,可以针对用户的问题和要求提供适当的答复和支持。在实际应用中,ChatGLM2-6B 可以用于智能客服、智能问答、智能推荐等领域,为用户提供更加便捷和高效的服务体验。
Space 上面还有很多好玩的,使用人工智能模型的应用,大家有兴趣可以点开试用。像下面的第一个就是文本和语音互转的应用。
https://huggingface.co/spaces
03
—
Huggingface Space 部署总结:
HF 注册账号;
添加 token;
添加支付方式,国内借记卡,信用卡均可;
能访问 HF 的环境;
默认情况下,硬件最小配置选择: t4-medium;
启动成功后,点 space 的 App,可以看到运行界面;
HF 提供永久地址,可以让应用被外部用户访问。
往期热门文章推荐:
性能提升571%,32K超长上下文,推理速度提升42%,允许商用,国产开源大模型推出了二代 ChatGLM2-6B
不允许还有人不知道可以免费用 ChatGPT 的网站,ChatGPT3 和 4,Claude 和 Claude+ 一网打尽
没有硬件资源?免费使用Colab搭建你自己的Stable Diffiusion在线模型!保姆级教程
拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。
部署, Hugging Face, 地址, 永久地址
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!