分类:机器学习
1.问题描述 二叉树中任意两个节点的距离指的从一个节点到达另一个节点所需要的最小边数。 2.问题求解 假设ro […]
题目描述:给定两个字符串A、B,求出两个字符串的最长公共子串和最长公共子序列。 解析:这两个题目很容易混淆,解 […]
这篇论文是阿里在IJCNLP-2017 中文错误诊断任务上的工作介绍。 1.介绍 中文语法形式灵活多变,给初学 […]
这篇论文是有道团队在2018 NLPCC会议语法纠错任务中的分享,他们取得了第一的成绩。具体如下: 1.中文语 […]
1.噪声信道模型 噪声信道模型是一个非常重要的模型,它在很多领域都有非常重要的应用。它是在上世纪80年代在语音 […]
最近在复习链表的常用操作,顺便整理到博客中方便以后复习。 1.链表定义 对于单向链表来说,包括数据域和指针域, […]
题目描述: 一根绳子长度为1,在绳子上任取两点,将绳子分成3段,计算这3段构成三角形的概率.
问题描述: 给定一个数据流,要求从n个元素中等概率的采样k个样本点,n的数值未知并且数量很大。 解析: 如果n […]
概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳 […]
最新发布的Spark1.3.1版本中已经实现了LDA的算法,并且以前实现过LDA+SVM进行文本分类的 […]
组织机构实体主要指企事业单位、公司、组织、网站等。我的主要是从文本中识别出组织机构实体名称来。鉴于条件随机场在 […]
在平时工作中经常用到条件随机场(CRF)进行任务处理,比如做一些标注工作和命名实体识别工作。自己比较常用的工具 […]
最近在学Spark开发,是调用的Java API开发的Standalone程序,Spark版本为0.9.1,S […]
Spark是由加州大学伯克利分校的AMP实验室开发的类似于Hadoop的开源集群计算环境,Spa […]