Python

Zenoss 报警 API

2012 6 月 29th

由lovelucy发表在Linux | 11,196 次围观

Zenoss 是一个开源的企业级 IT 基础设施智能监控软件，它允许 IT 运维人员通过 Web 界面控制台来监控整个网络架构的状态和健康度。通过配置，Zenoss 可以发现和管理公司的服务器、网络设备等各类资源。最典型的应用包括服务器宕机报警，我们已经实现了利用 Skype API 在服务器报警后自动打电话到运维的手机上。

这套系统太好用了，以至于我们希望能将它的报警机制应用到应用层。也就是说，不仅仅是运维可以用，程序开发屌丝也可以强势插入，比如在程序段错误崩溃、php error 时发一条短信给程序员，方便 debug，多么美好的愿景……

更多 >

PHP, Python, server, 运维, 配置

Python写爬虫——抓取网页并解析HTML

2011 6 月 10th

由lovelucy发表在编程 | 205,026 次围观

23个评论

CUHK 上学期有门课叫做 Semantic Web，课程 project 是要搜集整个系里面的教授信息，输入到一个系统里，能够完成诸如“如果选了A教授的课，因时间冲突，B教授的哪些课不能选”、“和A教授实验室相邻的实验室都是哪些教授的”这一类的查询。这就是所谓的“语义网”了啊。。。然而最坑爹的是，所有这些信息，老师并没有给一个文档或者数据库，全要靠自己去系主页上搜集。唯一的想法是写个爬虫，令人悲哀的是，所有做这个 project 的同学，都是纯人肉手工完成，看得我只想扶墙。。。

从网页中抓取特定信息，我觉得这是一个普遍性的问题，以后经常会遇到。幸亏那个 project 只是需要我们系的所有教授的信息，大家人工也就算了。如果需要抓取的信息是海量的，举个栗子，把淘宝上所有的商品目录抓下来，那岂不是要吐血而亡？我决定好好把爬虫研究一下。更多 >

Python, 字符串

反向索引Inverted Index – Map Reduce Program

2011 1 月 4th

由lovelucy发表在编程 | 11,778 次围观

没有评论

Inverted Index （反向索引）是搜索引擎需要做的一件经常性工作。在Google提出Map Reduce分布式编程框架中，这是一件很容易完成的事情。下面就是一个python写的示例。更多 >

MapReduce, Python, 分布式

单词统计Word Count – Map Reduce Program

2011 1 月 4th

由lovelucy发表在编程 | 12,244 次围观

2个评论

在学习Map Reduce方法时，Word Count（单词统计）程序是最基础的入门训练。不同的写法会有不同的执行效率，下面是用python写的一个示例。更多 >

MapReduce, Python, 分布式

Amazon S3 云存储服务Cloud Storage编程实践

2011 1 月 4th

由lovelucy发表在云计算 | 25,200 次围观

6个评论

Amazon Simple Storage Service (S3) 是一个云端存储平台，这是现在蓬勃发展的云计算的典型应用之一。用户可以将自己的数据上传到云端服务器，便可以随时随地地访问到这些数据，灵活高效。它按需收费，也就是说使用相应容量的存储空间，就花相应的钱。这里有具体的资费标准。对于企业用户来说，使用这项服务实际上可以大大降低成本，这些成本不仅仅包括自己购置服务器硬件、软件成本，还包括电力、为IT设施维护而雇佣的人力成本等等。

在Amazon S3中有如下几个概念，通过分别介绍，我们可以大致理解云存储的基本原理。

Buckets:一个bucket是一个用于存储的容器，我们可以不太恰当地理解为就是云端的文件夹。文件夹要求一个独特唯一的名字，这和注册邮箱名差不多，可以加前缀或者后缀来避免重名。bucket使得我们在一个高层级上组织命名空间，并在数据的访问控制上扮演重要角色。下面举个例子，假设一个名为photos/puppy.jpg的文件对象存储在名为johnsmith的bucket里，那么我们就可以通过这样一个url访问到这个对象：http://johnsmith.s3.amazonaws.com/photos/puppy.jpg
更多 >

Amazon Cloud, Python, 云存储

Zenoss 报警 API

Python写爬虫——抓取网页并解析HTML

反向索引Inverted Index – Map Reduce Program

单词统计Word Count – Map Reduce Program

Amazon S3 云存储服务Cloud Storage编程实践

微信订阅

访问统计

赞助商链接

Python

Zenoss 报警 API

Python写爬虫——抓取网页并解析HTML

反向索引Inverted Index – Map Reduce Program

单词统计Word Count – Map Reduce Program

Amazon S3 云存储服务Cloud Storage编程实践

微信订阅

用户登录

访问统计

赞助商链接