钛媒体独家获悉,科锐国际已接入DeepSeek-R1大模型,探索AI大模型与招聘特别是中高端招聘领域的深度融合,以期提升人才匹配效率。

科锐国际是国内首家登陆A股的人力资源服务企业,目前在全球已有100多个分支机构,其主营业务覆盖中高端人才访寻、招聘流程外包、灵活用工等全链条服务,及HR SaaS、垂直领域招聘等产品。成功推荐中高端管理及专业技术人员近20,000名,灵活用工累计派出人员38.3万余人次。

科锐国际CTO刘之指出,春节前后中国DeepSeek-R1推理大模型惊艳世界,这将进一步推动Agents技术的成熟。

他告诉钛媒体,“DeepSeek-R1是跟OpenAI o1平替但更经济的版本。DeepSeek-R1在大规模强化学习的原创式创新开创了先河。虽然模型的优势并不一定总是持续,社区会跟进的很快。但将工程和算法等跨学科深度融合的团队总是能做出特别优秀的创新,这才是最值得敬佩和学习的。”

但他同样指出,“虽然 OpenAI 去年 9 月就发布了 o1 推理大模型,我们已经在尝试使用o1为跨数据源的复杂RAG任务提供更高效的任务拆解能力,同时也在预研更需要推理能力的Agents。DeeSeek-R1和o1的推理能力类似,所以并没有因此改变我们的产品方案和策略。但与 o1 不同的是,DeepSeek-R1的思维链是透明化的,所以在进行意图理解和任务规划时可以将产品转变成交互会话式的,这会极大提高用户体验。”

刘之预计,“随着科锐国际在不同场景接入更多不同模型,DeepSeek-R1作为RAG和Agents的主力模型是完全可以的。”

早在去年5月,不少大模型提供商均在争相降价期间,DeepSeek-V2就已经体现出与闭源模型如GPT-4-Turbo和文心4.0在语言理解与生成方面的综合实力。直至年底12月DeepSeek-V3和1月20日DeepSeek-R1的先后发布,客观上为OpenAI等大模型厂商带来了压力。尽管DeepSeek-R1训练成本并未公布,但DeepSeek-V3据公布的训练预算为“2048个GPU、2个月、近600万美元”,外界认为R1在对标OpenAI o1模型的同时,训练成本也可能更低。

短短一个春节假期过后,国内外从芯片厂到云厂商都迅速公布了对DeepSeek支持。可以预期的是,在不同GPU和云算力平台上,DeepSeek系列模型会有不同的性能表现。

刘之指出,“目前独立部署DeepSeek-R1满血版的成本仍太高,所以我们直接采用云服务厂商的API。”

钛媒体注意到,科锐国际在2023年下半年就公开表示,已经训练了面向技能与招聘的行业级预训练语言模型CRE(CareerInternational Recruitment Embedding)。

但科锐国际如今没有选择直接走训练行业垂直大模型的路线,而是选择以行业垂直的Embedding模型和RAG技术为核心技术路线。科锐国际在2023年的两点判断是:一是AI的计算范式开始转变,即通过大量数据和算力而非单纯依赖模型架构的改进来提升性能。这不仅仅是大模型,也包括其他模型。比如时间序列模型、Embedding模型等;二是通用大模型的集中化趋势是肯定的,而垂直行业大模型面临诸多难以短期解决的技术难题。例如小模型的推理能力和知识不够,而大模型又难以微调且知识陈旧。

科锐国际一直在研发Embedding模型和提供RAG能力的MatchSystem匹配系统,以提升招聘效率和精准性。

刘之对钛媒体指出,“大模型总是要接入企业内部数据的。现在就三种方法:RAG、ICL上下文学习和微调。在拥有大量数据的情况下,RAG这条路是绕不过去的。而RAG又离不开搜索系统和Embedding。”

从2022年科锐国际开始布局数据中台建设,逐渐构建了一个庞大的数据系统。这些数据广泛覆盖20多个行业与细分领域。数据的多样性使得CRE Embedding模型能够在真实场景中更好地贴合实际分布,从而有效提升匹配的精准度和效率。

据刘之透露,CRE Embedding模型基于700GB公开数据和40GB行业简历与招聘需求数据进行预训练和任务微调。它能够深刻理解岗位需求和候选人简历中的复杂语义关系。由于招聘数据与连贯性文本是不同的两类数据,招聘数据不需要从头到尾阅读,通常会采用扫视阅读。因此在模型架构设计时更加关心局部关系。同时,通过多粒度特征融合和Transformer变体等技术使得CRE模型更符合招聘场景。

另外,Embedding模型也有一些缺陷是需要关键词检索来进行弥补的,因此MatchSystem是一个结合Embedding和关键词检索的混合检索系统。同时,MatchSystem也结合了RAG(检索增强生成),以满足一些更灵活的查询需求。

针对MatchSystem匹配系统的研发路径,刘之告诉钛媒体,“其实我们走到这一步,不只是大环境的影响,而是原来的技术方案确实不奏效了。”

以招聘场景中“人岗匹配”为例,过去招聘系统会使用一些标签或者知识图谱的方法,以实现人岗匹配。但这种匹配在一些中高端岗位中就会遇到问题,“比如招聘一位高级算法工程师,其实这个岗位是很难去定义的,对岗位人员使用的技术栈、工具平台、解决的问题和业务场景(推广搜)等等都有诸多考量。”岗位细分类型多、招聘需求因“岗”而异,为猎头顾问带来了不小的匹配难度。开源模型如智谱的向量模型BGE并不能满足招聘场景的需求,所以才开始自研。

在他看来,“招聘业务核心要解决匹配撮合,但不同的岗位和层次的痛点都不一样,所以解决方案也要进行调整。在基础岗位和初级岗位的招聘中,AI技术应该更强调自动化,例如通过自动化筛选简历,自动联系和跟进;而在中高端岗位招聘领域,AI技术应该更强调辅助,例如通过智能分析候选人背景和岗位适配度,帮助猎头顾问更精准地定位目标候选人。基础和初级岗位的招聘有望实现全流程自动化,而中高级岗位的招聘在部分流程中也将实现部分自动化。”

据悉,MatchSystem可准确匹配垂直类岗位的招聘需求,而不是泛泛的匹配。例如算法工程师这个岗位是非常细分的,但是通过MatchSystem系统,哪怕是细微的招聘差别,它都能实现精准匹配。再比如,在获客方面,原先需要花费一周时间来匹配候选人与企业用人需求的繁琐过程,现在通过MatchSystem系统可以实时完成。

“随着实时多模态大模型、长上下文、推理大模型等技术的逐渐成熟,科锐国际将抓住Agents的最佳进入时机,于2025年将推出PC端寻访自动化Agent和关系图谱预测的CRN(CareerInternational Relation Network)等。”刘之表示。(本文首发于钛媒体APP,作者 | 杨丽,编辑 | 盖虹达)

ad1 webp
ad2 webp
ad1 webp
ad2 webp