TSP Posted on 2018-05-21 | In Algorithms Words count in article: 6.5k | Reading time ≈ 22 我与TSP 我第一次接触TSP还是在今年寒假数学建模的时候,通过GA算法求解30个城市的TSP问题。当时用matlab实现的GA算法求解,看到这个动态搜索的结果我突然对这个问题产生了浓厚的兴趣,一直想要深入研究一下TSP问题,但中途总是被一些其他事情打断了。。。幸好,在算法设计与实践课上,TSP这个 ... Read more »
MNIST_deep Posted on 2018-05-06 | In DL Words count in article: 1.8k | Reading time ≈ 7 回顾 本文基于MNIST入门 123# load MNIST dataimport input_datamnist = input_data.read_data_sets("Mnist_data/", one_hot=True) 运行TensorFlow的Interacti ... Read more »
MNIST_test Posted on 2018-05-06 | In DL Words count in article: 4.5k | Reading time ≈ 16 机器学习中的”Hello World” MNIST是一个入门级的计算机视觉数据集,它包含各种手写数字图片,也包含每一张图片对应的标签,告诉我们这个是数字几。接下来将训练一个最简单的机器学习模型用于预测图片里面的数字。我们的目的不是要设计一个世界一流的复杂模型, 而是要介绍如何使用TensorFlow ... Read more »
tensorflow-beginner Posted on 2018-05-05 | In DL Words count in article: 2.1k | Reading time ≈ 8 Source官网 官方github仓库 中文版github仓库 安装pip install tensorflow $注意:从 1.2 版开始,TensorFlow 在 macOS 上不再支持 GPU$ 简介 TensorFlow是一个使用数据流图进行数值计算的开放源代码软件库。图中的节点op ... Read more »
word2vec Posted on 2018-05-02 | In NLP Words count in article: 2.7k | Reading time ≈ 9 词向量 词向量(word embedding)是为了让计算机能够处理的一种词的表示。自然语言处理(NLP)相关任务中,要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,因为机器不是人,机器只认数学符号。向量是人把自然界的东西抽象出来交给机器处理的东西,基本上可以说向量是人对机器输入的 ... Read more »
jieba Posted on 2018-05-01 | In NLP Words count in article: 2.3k | Reading time ≈ 9 Source官方文档 github地址 特点 支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 支持繁体 ... Read more »
Formal-language-theory-and-automata Posted on 2018-05-01 | In NLP Words count in article: 3.3k | Reading time ≈ 12 形式语言理论的研究对象 , 除了自然语言之外 , 还包括程序语言和其他人工语言。如果一个语言存在对它的识别过程 , 则一定也存在对它的产生过程。反之亦然。由此,刻画某类语言的有效手段, 是文法和自动机。文法用来生成语言的句子, 自动机用来识别语言的句子 , 就描述一种语言 而言 , 两者是统一的。 ... Read more »
POS-tagging Posted on 2018-05-01 | In NLP Words count in article: 1.5k | Reading time ≈ 5 判定给定句子中每个词的语法范畴, 确定其词性并加以标注的过程 (刘开瑛 2001)。词性标注歧义 : 如果词 w 存在两个或两个以上的词性 , 则词 w 具有词性标注歧义。词性标注是一个比较活跃的研究领域,它可以应用到许多领域, 其中包括: 口语识别和生成 , 机器翻译 , 信息检索和词典编篡等。 ... Read more »
lexical-analysis Posted on 2018-04-30 | In NLP Words count in article: 3k | Reading time ≈ 10 1.汉语的自动分词 主要包括下面两个步骤:1 . 根据分词规范 , 建立机器词典。2 . 根据分词算法和机器词典 , 把字串切分为词串。 重要性 汉语的词也是汉语语言中最小的独立运用单位。自动分词是现代汉语进行句法分析的第一步,是后续语法和语义分析的基础。汉语分词的关键在于 , 好的分词算法和好的 ... Read more »
Introduction-to-Computational-Linguistics Posted on 2018-04-29 | In NLP Words count in article: 1.7k | Reading time ≈ 5 1.概念 计算语言学 , 也称自然语言处理或自然语言理解 , 它是研究如何利用计算机来理解和生成自然语言。 计算机对自然语言的研究和处理 , 一般应经过如下 4 个过程 :1 . 从语言学角度提出自然语言处理的问题和理论(linguistic problem)。2 . 把需要研究的问题在语言学上加 ... Read more »