人生重开器网页版

0

1. MockingBird:AI拟声,5秒内克隆您的声音并生成任意语音内容

说明:GitHub上有一个项目最近登上了每日趋势榜,只需5秒,就能用AI 技术来模拟声音来生成任意语音内容,并且还支持中文。开源地址:https://github.com/babysor/MockingBird演示视频:https://www.bilibili.com/video/BV17Q4y1B7mY

2. OpenAI最新技术Codex,不会代码也能编游戏

说明:OpenAI 旗下编程产品Codex 已经正式开放封闭 Beta 测试。这款工具旨在将自然语言(英语、中文等)翻译为编程语言。它是一个简单的网络工具,具有三个窗口:一个用于输入命令,一个显示由这些命令生成的代码,一个显示代码的作用。理论上,您可以将 Codex 用于十多种编码语言的各种任务,但最酷的用途是使用少量自然语言指令编写简单的 Javascript 游戏。项目地址:https://openai.com/blog/openai-codex/演示视频:https://www.youtube.com/watch?v=SGUCcjHTmGY

3. Real-ESRGAN:用纯合成数据训练真实世界的盲超分辨率

说明:ESRGAN、EDVR等超分领域里程碑论文的作者在超分领域的又一力作,他们对ESRGAN进行扩展,将其应用场景从合成数据向真实场景数据走了一大步。针对现有图像超分、盲图像超分退化模型设计的不足,提出了一种高阶退化建模方案;针对高阶退化空间下原始判别不稳定问题,提出了UNet+SN的超强判别器。最终所得Real-ESRGAN在真实场景数据下取得了非常优秀的、视觉效果绝佳的超分效果。开源地址:https://github.com/xinntao/Real-ESRGAN演示地址:https://huggingface.co/spaces/akhaliq/Real-ESRGAN

4. 英伟达开源StyleGAN3:皮肤、毛发不再粘屏幕,还能360度旋转

说明:StyleGAN生成式对抗网络是一种最先进的高分辨率图像合成方法,从最初的GAN到StyleGAN2变体,其图像合成能力一直在突破人类的想象,而这次升级版StyleGAN3的对生成细节的把控更是令人惊叹。它从根本上解决了StyleGAN2 图像坐标与特征粘连的问题,实现了真正的图像平移、旋转等不变性,大幅提高了图像合成质量。开源地址:https://github.com/NVlabs/stylegan3

5. RobustVideoMatting:稳定的人物视频抠像

说明:来自字节跳动的算法,不同于现有神经网络将每一帧作为单独图片处理,RobustVideoMatting(RVM)使用循环神经网络,在处理视频流时有时间记忆。RVM 可在任意视频上做实时高清抠像。在 Nvidia GTX 1080Ti 上实现 4K 76FPS 和 HD 104FPS。开源地址:https://github.com/PeterL1n/RobustVideoMatting演示地址:https://peterl1n.github.io/RobustVideoMatting/#/demo

6. Game Life Restart:人生重开模拟器

说明:一款纯文字内容的网页游戏,3天就创造2亿访问量。玩法超级简单:“你”重开人生,扮演一个刚诞生的婴儿,通过“开局10连抽”为自己选择3种天赋,并将20点(在天赋作用下点数总值会变动)初始属性值分配到颜值、智力、体质和家境,即可以文字描述的方式开启“新人生”。开源地址:https://github.com/VickScarlet/lifeRestart试玩地址:https://liferestart.syaro.io/view/index.html

7. air-drawing:手势估计,通过摄像头隔空写字、绘图

说明:这个工具使用深度学习来帮助你用你的手和网络摄像头画画和写作。 一个深度学习模型被用来预测用户意图:你是想要笔画(“向下”)还是只是移动你的手(“向上”),随着手指的移动,可以在屏幕上隔空绘制图形。开源地址:https://github.com/loicmagne/air-drawing演示地址:https://loicmagne.github.io/air-drawing/

8. GFPGAN:向真实世界的基于生成面部先验的盲目面部恢复

说明:腾讯ARC实验室最近发布了一篇论文GFPGAN,旨在开发实用的人脸复原算法 ,介绍了盲人脸修复模型GFP-GAN,不仅性能快,结果还保真,尤其对模糊的老照片效果非常好。开源地址:https://github.com/TencentARC/GFPGAN演示地址:https://huggingface.co/spaces/akhaliq/GFPGAN

9. StyleGAN-NADA:基于CLIP模型的图像生成器

说明:StyleGAN-NADA提出了一种文本驱动的方法,生成模型可以在没有看到任何图像的情况下,通过训练产生特定领域的图像。 通过自然语言提示和几分钟的训练,此方法可以适应一个生成器跨多个领域的特点,包括不同的风格和形状。开源地址:https://github.com/rinongal/StyleGAN-nada演示地址:https://replicate.ai/rinongal/stylegan-nada

10. DeepFaceLive:实时换脸PC流媒体或视频通话

说明:DeepFaceLive是DeepFaceLab作者的又一个开源力作,推出实时换脸软件,主要用于直播啊场景。一键安装,打开软件,就能够实时处理直播中的视频,给主播换脸。开源地址:https://github.com/iperov/DeepFaceLive

标签:

留言评论