近日,由 @ammaar 开发的创新项目 Openjourney 引发广泛关注。这款工具不仅在界面上巧妙模仿了 MidJourney,更在技术核心上深度整合了 GoogleGeminiSDK,并集成了强大的 Imagen4 和 Veo2/3 模型,为用户提供了一站式的 AI 图像和视频生成解决方案。Openjourney 旨在让用户轻松利用 AI 生成高质量的图像和视频,同时享受与 MidJourney 相似的直观交互体验。
Openjourney 充分利用 Imagen4 模型,能根据用户输入的文字描述生成四张 1024x1024 像素的高清图片。它的界面设计借鉴了 MidJourney 经典的四宫格布局,并加入了实时加载动画,大大提升了用户体验。生成的图片可以直接下载、放大查看,甚至能一键转换为视频。
在视频生成方面,Openjourney 同样表现出色: 通过 Veo3 模型,用户只需输入文字描述,即可生成一段带音频的 3-5 秒 720p 短视频; 借助 Veo2 模型,静态图片也能 「动起来」,用户选择一张图片并添加文字描述,即可将其转化为动画视频。视频内容以 2x2 网格形式展示,鼠标悬停即可自动播放,交互性极强。
Openjourney 在用户体验方面也考量周全。其输入框简洁直观,用户输入提示词后点击 「生成」 或按下回车即可开始。平台支持全屏查看和下载作品,并通过箭头键方便用户翻阅生成历史,如同翻看相册一般。界面的流畅动画效果得益于 FramerMotion,而加载时的 「骨架屏」 占位则进一步提升了专业感。
Openjourney 的技术栈现代且 robust,非常适合开发者学习和二次开发。它采用 Next.js15(包含 AppRouter 和 Turbopack) 作为前端框架,确保了出色的性能和开发体验; 使用 TypeScript 提升了代码可靠性; 基于 TailwindCSSv4 快速构建美观界面; 利用 FramerMotion 实现流畅的交互效果; 并整合了 ShadCN 和 RadixUI 保证界面的美观性和无障碍标准。其核心 AI 能力正是通过 GoogleGeminiSDK 调用 Imagen4 和 Veo2/3 模型来实现图像和视频生成。
Openjourney 的发布,无疑为开源社区带来了 MidJourney 的一个强大且充满潜力的替代方案,展示了 GoogleAI 技术在创意应用领域的广阔前景。
地址:https://github.com/ammaarreshi/openjourney










