基于用户浏览记录的网页rank思路

Google的pagerank就不多介绍了,一个能衡量网页重要程度的算法,本质上是网页相互投票的结果,基于这个特性,我们可以通过使用sitemap让搜索引擎尽可能浏览到多的网站内容,也可以通过多做外链来提高网站的PR值,达到SEO的目的。市场上大多数搜索引擎都在使用pagerank类似的方法,且为了保证公正性,都采用纯机器运行的方式,通过网页爬虫来遍历网站,这就出现了一些有趣的问题:一个网页的内容是很棒的,但是由于外链太少,爬虫在设定的深度阈值下可能无法爬到它,成为了少人问津的“暗内容”部分网站因为PR值很高,即使转载的内容或是价值不高的内容,也可能有很好的检索排名,即使技术领先的搜索引...

技术在不断进步,革新的互联网产品推陈出新,一种又一种商业模式不断创造着财富神话。经济学的基本规律并未因为这些改变而发生动摇,看不见的手依然决定着新产品的市场价格,如果你是一个投资者,价值规律依然可以帮助你识别那些虚高的股票。产品的成本互联网时代的产品是智力密集型的,比如微软...

太阳底下没有新鲜事,不管信息时代对传统商业模式造成了多大的冲击,背后的经济规律并没有发生多大改变,那些经典的经济学分析工具依然能帮助我们理解网络经济,为互联网产品制定各种策略。产品的定价策略网络经济里的产品形态有很多种,它可以是真实的手机或笔记本电脑,也可以是iPhone上...

很早就想写一篇日志,罗列一下我使用过的手机,挺有意思的事情我人生第一个手机是摩托罗拉的T191。那是上大学不久,趁着家乐福促销599买的,穷学生一个,是一笔巨款。记得当时特别特别高兴,后来也就不到半个月,在一次重大的庆典活动里丢了,真是抑郁了好久,觉得自己对不起家里人,买个...

歌词是承载歌曲情感的文字,是歌曲本意所在,本文旨在构建一个基于中文文本情感倾向分析的歌曲推荐模型。作用:1、输入一首歌曲,可以找到与该歌曲类似情感的其他歌曲2、输入一个情感词,如“伤感”,可以找到“伤感的歌曲”以歌词作为情感特征分析的原料有如下优势:1、存储成本低,歌词全文...

LBS很火,基于check in可以设计一些真人互动的游戏,比如即时战略类、战棋策略类游戏一、场景以城市为基本背景,考虑到漂移的问题,将城市划成若干小区块,通过check in占领作为领地。1、领地的价值体系,以北京为例,饼状向外扩散,也就是越中心的地区价值越高,产生的收入...

2007年我刚加入一听团队的时候,网站技术实验室上线了一款产品叫做“一听聆听”,简单来说就是输入一个歌曲名或歌手名,可以随机播放与此关键词有关的歌曲。作为搜索技术开发的副产品,聆听意外获得了不少用户的好评,在后来因为网站架构调整关停了此项服务的日子里,我们时不时会收到要求开...

某天参加pmcaff北京的小小聚会,主题是无线应用的产品设计,我准备了一个有关于手机音乐播放器小小的分享作为开场话题引导,班门弄斧了,内容大致如下:一、产品的基础条件用户:使用Symbian S60 V3、2G、普通键盘的路人甲情境:公交地铁、洗手间等碎片时间内容:手机中已...

PC客户端软件的皮肤配置方式有很多种,简单说来就是如何把图片在屏幕上贴起来,从需求上看,可能要应对多套皮肤、多种配色、异型皮肤等等。有的软件选择将所有小图片放在一张大图上,有的软件喜欢用各种小图放在一个目录下,还有的采用了混搭的方式,这里讲的是第一种。先放出一张结构图来,方...