入门机器学习?好好看看《智能问答与深度学习》随书附带源码

《智能问答与深度学习》随书附带源码

《智能问答与深度学习》 这本书是服务于准备入门机器学习和自然语言处理的学生和软件工程师的,在理论上介绍了很多原理、算法,同时也提供很多示例程序增加实践性,这些程序被汇总到示例程序代码库,这些程序主要是帮助大家理解原理和算法的,欢迎大家下载和执行。代码库的地址是:

https://github.com/l11x0m7/book-of-qna-code

在阅读本书的过程中,各章有示例程序的段落会说明对应代码库的路径。同时,在代码库中,也有文档介绍如何执行程序。

安装依赖软件

快速执行源码的最佳实践是通过 docker 容器,读者需要在计算机中安装

  • Git

Git 是一个分布式版本管理工具,目前很多开源码项目使用它发布和协作,下载地址:

https://git-scm.com/

  • Docker

Docker 是容器技术,容器是一种构建、发布和执行软件服务的标准,容器能屏蔽操作系统的不一致性,简便了软件发布、开发和运维,下载地址:

https://www.docker.com/

这两个工具能兼容多种操作系统,我们强烈建议在阅读本书的第三章前,安装二者。

下载源码

在命令行终端,使用下面的方式下载源码:

git clone https://github.com/l11x0m7/book-of-qna-code.git book-of-qna-code

执行示例程序

启动容器:

cd book-of-qna-code
./admin/run.sh # Mac OSX, Linux, Unix

初次运行该脚本时,会下载 docker 的镜像,在这个镜像中,我们安装了示例代码执行需要的依赖环境,这一步骤可能占用半个小时或更长时间,程序执行完毕,命令行终端会自动进入容器内部,如下图:

在这里插入图片描述

至此,读者就具有可执行示例程序的环境了,详细使用说明参考各项目文件夹内的文档。

取得帮助

在您遇到关于软件安装、容器运行、程序代码执行等问题时,可通过下面地址反馈给我们:

https://github.com/l11x0m7/book-of-qna-code/issues

第二章 机器学习基础

马尔可夫链

隐马尔可夫模型

CRF 模型

第三章 自然语言处理基础

有向无环图(DAG)

MMSEG 中文分词器

HMM 中文分词器

依存关系分析之 transition-based 经典算法

依存关系分析之 transition-based 神经网络算法

Apache Lucene 示例程序

Elasticsearch 信息检索

第四章 深度学习初步

lightnn:教学用神经网络工具包

Siamese 神经网络完成问答任务

Siamese 卷积神经网络完成问答任务

Siamese 循环神经网络完成问答任务

第五章 词向量实现及应用

该章节主要为大家介绍深度学习在自然语言处理中必不可少的部分:embedding。此处我们为大家介绍了三种比较经典的词向量模型:word2vec,glove 以及 fasttext。通过实现这三个模型,并在小数据集上测试,帮助大家更好的理解这三个模型的原理。

N 元模型(ngrams)

word2vec 的简单实现

glove 的简单实现

fasttext 的简单实现

第六章 社区问答中的 QA 匹配

该章节主要介绍社区问答中的问答匹配问题,并介绍具有代表性的几个深度匹配模型。在该章中我们给出一个简单易用的 pairwise 的问答匹配网络 QACNN。

Pairwise 形式的 QACNN 模型

Decomposable Attention 模型:复现《A Decomposable Attention Model for Natural Language Inference》

多比较方式的比较-集成模型:复现《A COMPARE-AGGREGATE MODEL FOR MATCHING TEXT SEQUENCES》

BiMPM 模型:复现《Bilateral Multi-Perspective Matching for Natural Language Sentence》

在线讲解

《智能问答与深度学习》的在线课程由本书作者团队,CSDN 学院和电子工业出版社联合发布【详情链接】。

从0开始深度学习链接

推荐阅读

Chatopera 研发团队 聊天机器人 机器学习 智能客服
https://www.chatopera.com 北京华夏春松科技有限公司:为企业交付智能客服系统、智能对话机器人、机器人客服、Chatbot。
已标记关键词 清除标记
相关推荐