人工智能应用一般分为图像处理,音视频处理,以及文字处理这三大类。这里主要介绍音视频处理在不同场景下的应用。
【视频人脸融合】
视频人险胜合功能,可以帮助用户在获得授权的前提下,将视频中的指定的某个人脸替换成你想要的人脸。
【视频人像卡通化】
根据输入的人像视频进行卡通化转换,返回风格化后的视频结果,支持日漫。
【视频画幅变换】
可以将输入视频通过智能裁切和填充输出任意分辨率的视频。
【视频字幕擦除】
擦除视频中的"标准"字幕,如电影电视剧中下方的白色字幕。
【视频校色】
输入一组视频,输出一组调色后的视频。可根据视频之间的相似性进行关联调色。
【SDR转HDR】
SDR转HDR可将普通SDR视频转化为HDR视频,以提供更高品质的视频。
【视频人像增强】
基于GPEN人像增强模型,对视频中的人脸进行清晰度提升,显著增加面部细节。
【视频障噪】
基于多帧修复模型,对视频中的各类噪声信息进行降低,同时保持帧间的稳定性。
【物体检测】
检测图像中的物体。可识别90类物体,例如:人体、椅子、篮球、摩托车等。
【白底图检测】
检测输入图片背景是否为白底图。
【猫鼠识别】
基于视觉AI算法、物联网、大数据分析技术,检测场景中是否有猫、老鼠等动物。
【着装检测】
基于视觉AI算法、物联网、大数据分析技术,检测指定场景范国内的人员穿戴情况。
【呼叫中心】
智能外呼、音频质检与分析等语音解决方案.
【语音数字大屏】
提供智能化可交互的语音数字大屏解决方案。
【智能语音会议】
助力节省会议纪要人力成本,提高工作效率。
【智能语音指令】
智能一体化系统,适用于手机APP/大屏指令交互。
【语音合成】
提供高度拟人、流畅自然的语音合成服务。
【语音识别】
将语音快速准确识别为文字,支持各类场景。
【定制音库】
打造高还原、高清晰、高稳定的音库定制服务。
【有声阅读】
支持多角色多情感与个性化音库定制。