在数据挖掘中需要大量的数据,这些数据往往存储在数据库中或者文件中。存储数据库中比较好理解,可通过 程序数据库接口+SQL语句 获取。存储在文件中则往往有多个按日期命名的文件夹,数据以文本格式存储,且有特定的分割符。本文主要就是讲述如何通过python读取后一类的数据。

阅读全文 »

网络编程简介

网络通讯的方式有TCP和UDP两种,其中TCP方式的网络通讯是指在通讯的过程中保持连接,有点类似于打电话,只需要拨打一次号码(建立一次网络连接),就可以多次通话(多次传输数据)。这样方式在实际的网络编程中,由于传输可靠,类似于打电话,如果甲给乙打电话,乙说没有听清楚让甲重复一遍,直到乙听清楚为止,实际的网络传输也是这样,如果发送的一方发送的数据接收方觉得有问题,则网络底层会自动要求发送方重发,直到接收方收到为止。

阅读全文 »

原题如下: >Given n non-negative integers a1, a2, ..., an, where each represents a point at coordinate (i, ai). n vertical lines are drawn such that the two endpoints of line i is at (i, ai) and (i, 0). Find two lines, which together with x-axis forms a container, such that the container contains the most water.

阅读全文 »

《Programming Collective Intelligence》(中文名为《集体智慧编程》),是一本关于数据挖掘的书籍,每一章都会通过一个实际的例子来讲述某个机器学习算法,同时会涉及到数据的采集和处理等,是一本实践性很强的书籍。

本文是关于本书的第一章 Introduction to Collective Intelligence ,主要介绍了 collective intelligence 以及 machine learning 的一些概念。

阅读全文 »

这篇文章是当时在新浪云上搭建博客的时候写的,后来因为新浪云收费了,把网站迁移到了github上。这里还是把文章贴出来,做个记录。

最近在写本站的评论提醒功能的时候,需要通过 python 发送邮件提醒具体哪些文章有了新评论,采用邮件的方式便于在特定时间处理所有的评论,比如说在第二天早上7点检查网站昨天是否有新的评论,假如有就会发送邮件显示那些有新评论的文章。

阅读全文 »

转载,作者:李晓鹏,侵删

这篇文章本来是该几年前写的,奉劝大家不要去玩股票。因为那个时候我的《中国崛起的经济学分析》这本书刚刚出版,里面用“破坏性要素参与分配”的理论来分析了中国经济。在写作过程中我发现这个理论也可以顺便用来解释股票市场,让大家看清楚股票市场的本质。但当时的大盘指数才1980点,我怕写出来很多人会被我“忽悠”,把手里的股票“割肉”卖掉,回头会恨死我。所以就忍了。

阅读全文 »

众所周知,Java是一门编译型语言,需要编译成字节码才能在JVM上运行。常用的IDE如Eclipse等将编译、运行等步骤结合起来一起执行,只需要按下Run即可完成编译和运行的工作。但是实际上编译java程序的核心是JDK。本文主要讲述了只安装jdk通过命令行来编译运行Java程序。

阅读全文 »
0%