百度开源中文主题建模工具集,三种主题模型

百度Familia 开源项目包含文档主题推断工具、语义匹配计算工具以及基于工业级语料训练的三种主题模型:Latent Dirichlet Allocation(LDA)、SentenceLDA 和Topical Word Embedding(TWE)。 支持用户以“拿来即用”的方式进行文本分类、文本聚类、个性化推荐等多种场景的调研和应用。考虑到主题模型训练成本较高以及开源主题模型资源有限的现状,我们会陆续开放基于工业级语料训练的多个垂直领域的主题模型,以及这些模型在工业界的典型应用方式,助力主题模型技术的科研和落地。

原文网址:https://github.com/baidu/Familia

相关文章
2018中国移动全球合作伙伴大会议程主题介绍
2018中国移动全球合作伙伴大会议程主题…
VR+IP 线下主题娱乐新爆点
VR+IP 线下主题娱乐新爆点
世界电信日大会到来  演讲嘉宾、主题曝光
世界电信日大会到来 演讲嘉宾、主题曝光
万代南梦宫公布《黑暗之魂:重制版》中文剧情PV
万代南梦宫公布《黑暗之魂:重制版》中…
中国梦主题原创网络视听节目征集活动正式启动
中国梦主题原创网络视听节目征集活动正…
爱奇艺电视果联手Wstudio上线智能投屏主题会客厅
爱奇艺电视果联手Wstudio上线智能投屏主…
我还没有学会写个人说明!