2014年刚刚过去,2015年翘首而来,回顾2014年有 […]
组织机构实体主要指企事业单位、公司、组织、网站等。我的主要是从文本中识别出组织机构实体名称来。鉴于条件随机场在 […]
在平时工作中经常用到条件随机场(CRF)进行任务处理,比如做一些标注工作和命名实体识别工作。自己比较常用的工具 […]
最近在学Spark开发,是调用的Java API开发的Standalone程序,Spark版本为0.9.1,S […]
今天在Ubuntu12.10中解压windows中压缩的文件夹,解压以后发现文件名称均为乱码,而里面的内容没有 […]
前段时间安装了Eclipse Kepler,安装以后明显感觉代码字体较小,尤其是注释中的中文字体。通过查找资料 […]
Scala的开发环境有两种,一种是Scala IDE,另一种是在Eclipse中增加插件,下面分别简单描述搭建 […]
Spark是由加州大学伯克利分校的AMP实验室开发的类似于Hadoop的开源集群计算环境,Spa […]
在使用Spark进行分布式的应用,每次启动主机上面的服务都需要输入从机上的密码,太费事了,试着做了一下SSH无 […]
前面的VNC安装的步骤与Ubuntu Server 12.04安装桌面环境以及配置VNC里介绍的内容相同,区别 […]
在windows下一直习惯了使用Chrome,最近开始使 […]
最近在做基于LDA(Latent Dirichlet Allocation)的文本分类处理,开始学习和接触了L […]
最近在学习命名实体识别,在查阅资料的同时,对命名实体识别的概念以及常用方法做了一下 […]
系统环境:Ubuntu Server 12.04 &n […]
历时两天的我们部门的年终总结汇报刚结束,趁着余温我也总结 […]