03月
11th 2012
诗词中的”虚拟语气”

Posted under 想写就写

虚拟语气原名 Subjunctive Mood 用来表示说话人的主观愿望或假想,而不表示客观存在的事实,所说的是一个条件,不一定是事实,或与事实相反。。。

前天晚上坐地铁翻看手机里的唐诗三百首,觉得某些诗绝对就是虚拟语气的最佳例证:

忽见陌上杨柳色,悔叫夫君觅封侯 王昌龄

纠结的男女关系啊,丈夫守着你觉得他太平庸,太没用;出去建功立业又成了怨妇独守空房,世间安得两全法,不负如来不负卿。

向使当初身便死,一生真伪复谁知 韩愈
空悲切的英雄白了少年头,霍去病24岁暴毙,好歹已成一代名将,还有无数等了一生也没等到施展才华机会的杜甫、陆游、苏东坡们,“致君尧舜上,再使风俗淳”也只是句愿景,“出师一表真名世,千载谁堪伯仲间”才是最真实的写照。

如果我们把虚拟语气的定义再拓展一点,会发现几乎成了很多脍炙人口之诗词所必遵循的金科玉律,诗人的想象和现实落差越大,读者心中的感触也会越强。

亲情篇:

双行桃树下,抚背复谁怜 - 李白 寄东鲁二稚子 再潇洒不羁的男人也会有温柔的小情怀,尤其是面对可爱的儿女,可以想象愿为他们抛弃一切的感情

今夜鄜州月,闺中只独看。 遥怜小儿女,未解忆长安。 香雾云鬟湿,清辉玉臂寒。 何时倚虚幌,双照泪痕干 - 杜甫 月夜
杜工部忧心天下疾苦,更记挂远在千里之外的亲人们,甚至已经预见到和妻子见面泪奔的场景,但在那时再多的泪水也比现在千愁百缕的思绪要强啊。

感情篇:

何当共剪西窗烛,却话巴山夜雨时 - 李商隐 夜雨寄北 想象能和妻子再见面,那时谈论现在分隔两地互相思念的情景,该又是另一番滋味在心头

友情篇
何时一樽酒,重与细论文 - 杜甫 春日忆李白 挚友之间的惺惺相惜和感叹对方的生不逢时,更有自己感同身受的心情(文章憎命达,魑魅喜人过)

宇宙篇:
江畔何人初见月 ,江月何年初照人 - 张若虚 春江花月夜 有种追求人生和宇宙本源的感觉,格局博大

No Comments »

01月
29th 2012
考核SEO Campaign的五大指标

Posted under 想写就写

via http://econsultancy.com/us/blog/8740-top-five-kpis-for-seo-campaigns

1. 关键词排名

SEO项目最常使用的KPI之一,当然,高排名本来不就是SEO的一大目标嘛。问题在于很多有排名的关键词带不来流量,或者即使带来流量但转化极差。

因此,建议在排名这项KPI上再附上每个词带来的流量、订单或者收入数据以显示这些词的价值。

2. 流量

流量很重要,但是流量的质量比数量更重要,是否来源于精准的受众或关键词,是否有相当的转化率?

更好的做法不是简单的看一个总量,而是将流量细分,分渠道分析不同来源流量的质量。

3. 非品牌词的自然流量

品牌词流量受其他因素影响较大,因此观察非品牌词的流量走势更能说明SEO项目的成功与否。

4. ROI

这可以视为最重要的指标,因为一切项目最终目的还是为了盈利。

当然,作为SEO你无法改变商业模式,但是可以在你可控的范围内,与现行的商业模式做一些更好的结合,做一些针对性的调整,提高ROI应该是最让老板开心的目标。

5. 品牌曝光

品牌也是SEO不可忽视的一快,如果忽略了品牌类关键词,会有两个问题。

1.没有品牌词的支撑,非品牌词获得排名也会比较费劲

2,如果品牌词排名不好,会丧失很多从非品牌词知道你网站的潜在用户。

因此,最低目标品牌词的第一页必须都是你网站的页面。下面这张图可以分析用户的关键词搜索路径

Multi Channel Funnel Attribution

No Comments »

01月
19th 2012
正常SEO和超级SEO的区别

Posted under 想写就写

设计好看的网站是好的SEO,把内容放到强力信息架构里面的是超级SEO

急速推动上线 VS 上线前仔细检查

着眼于SEO VS 着眼于ROI

优化电商网站 VS 一系列的优化规划

短平快 VS 长线

关键词研究 VS 关键词细分

填充关键字 VS 用户友好内容建设

采集内容 VS 原创内容

原创内容 VS 过目难忘的内容

满足用户需求 VS 让用户感觉出众

优化重要关键词 VS 优化海量关键词

估计排名 VS 获得排名

获得排名 VS 经营资产

提高流量 VS 增加订单

理解算法 VS 理解分析

r.

No Comments »

01月
2nd 2012
天与地 When Heaven Burns

Posted under 想写就写

好久没看TVB的我最近连续追了几个礼拜,看完了年度大戏《天与地》,不得不说,从整部剧跌宕起伏的情节,演员细致入微的刻画到制作人着力烘托出的有点哲学味的主题,都是让人眼前一亮,在2011一众穿越剧,谍战剧,名著剧看得让人倒胃口之后,称得上是一部用了很多心思的作品。我最欣赏有这几点:

天与地

1.剧本扣人心弦:整篇故事蕴含着一个主线,五个好朋友从相知相识到组乐队参加比赛,之后无奈解散,最终决定去天山参加摇滚音乐节以告别青春岁月,谁知山上发生意外,三个好朋友为自保不惜杀死受伤的家明食肉以撑到下山(这情节有点像连城诀里面花铁干吃师兄的桥段),其后十八年三人各有各的命运,有的失忆忘记这段往事结婚生子,另外两人被不堪的回忆苦苦煎熬,性格人生都发生了剧烈的变化。但三人都共同关心当初的女孩Hazel,也就是家明的女朋友,随着18年前的真相被逐渐揭开,大家都得直面之前和之后的人生,最终结局貌似都很惨,但对这三人来说又未尝不是种解脱。

2.台词发人深思:整部剧好的台词太多了,比如:“生活不一定都是挫折,生命也不一定都要妥协” “喜欢音乐的人,不会坏到哪去” “人一生最早听到的音乐就是母亲的心跳声,因此音乐的意义就是生命” “今时今日与其要我花心思和精神去担心一些改变不了的事实,我宁愿好好对待身边的人.是多年不见的朋友也好,是家人也好.这才是我目前最该关心的事情.”

到了今时今日,依然会有人问我,何谓Rock & Roll的精神.这个问题,我答了三十几年1.回想起来,来来去去都是那几句不难说的话:独立的精神,抗拒建制,自由,爱,勇往直前.其实何止是Rock & Roll,我们做人不是本来就应该这样吗?”(我疑心这几句台词导致被广电总局封杀)

我不懂得跟你说什么叫公平,但什么是不公平我懂得分辨.

你有这个病,我觉得上天对你不公平;Katie担心你,但是你不给她机会去帮你,我觉得是你对她不公平.
而你口口声声说没人能给你答案,所以你不想去麻烦别人,
但是正因为你不开口,其他人根本不知道你的问题是什么.
所以,试问你一口咬定他们没有答案,这又公平吗?
尝试去接受别人的帮忙,信任其他人可以帮助你,
这并不表示你就变成了一个弱者,因为你能够令他们有机会这样做,
对他们来说,可能才是一种幸福.”

3演员大飙演技:给我印象最深的无疑是林保怡扮演的刘俊雄一角,把他性格转变的历程,内心的情感纠结,对社会和人的看法展现得淋漓尽致,当然金燕玲的Brenda虽然戏份不多,但把一个女强人心中的柔弱一面演绎得恰到好处,人都是需要爱的。佘诗曼 陈豪 黄德斌的表演也是各有特点,bytheway 他们的英文名都蛮给力的 Hazel Ronnie Angus 不落俗套,嘿嘿。

4.音乐与我共鸣 黄贯中作曲 林若宁作词的片尾曲《年少无知》我一听就难以割舍,尤其是高潮部分用风笛吹奏出来后反复作为电视的背景音乐,和情节、人物的表演搭配得恰到好处。林保怡出过专辑自不必说,陈豪在剧中的几次演唱也给人惊喜,他的澳洲口音很喜欢,嘿嘿,另外林保怡打鼓和陈豪弹贝司的姿势煞是专业哦

5.结局出人意料: 昨晚到两点看完结局,编剧别出心裁,虽然真实的结局让人唏嘘,被撞死的刘俊雄,失明入狱的Ronnie,终身孤单的Angus,唯有看透世事的叶子恩稍让人安慰。  不过编剧皆由叶子恩的想象描绘出另一番人生:假使家明没去天山,他们这些老友现在的情况又是绝然不同的一番情景,人生往往就是由一个很小的决定改变了一切。 这个结局很有意思,只是老的家明扮演者实在是太丑了,远没有年轻的家明飘逸俊朗。

No Comments »

11月
6th 2011
打造爬虫最佳体验

Posted under 想写就写

我们可以假设一个完美的情况,就是搜索引擎爬虫每天来一次,抓取完了当天产生的所有新页面无一遗漏,然后第二天全部收录在主搜索里。

当然这是不可能的,原因在于:

1.爬虫程序有瓶颈,就算是人工也无法精确判断出一天内,或者和上次抓取相比新增或修改的所有页面;新页面通常不会是频道页,目录页(这类页面基本爬虫每次来都会重新抓取一遍);而是资讯页和产品页,这些页面的问题在于内链过少,极有可能在列表首页仅仅停留了一两分钟就沉到十几页之后,超出了爬虫所能抓取的极限

2.即使新页面被抓取后,也得经过搜索引擎后台的比较、去重和分析等一系列步骤后,搜索引擎认为这一页面具有足够的价值,且能满足搜索者的潜在需求,再会把页面放出到主搜索数据库也就是通常意义上的收录。

所以结合以上两个情况,如何能最大限度上让新页面被收录呢?

1. 页面内容唯一性极强,很多产品页面可能只是颜色或者价格稍做改动,其他介绍和参数都是一样的,那就极易让搜索引擎判为重复页面,这种情况下就得花大力气充实页面内容,突出每个产品或服务的特点;如果能适当引入用户的评论信息就更棒了,因为不同产品的评论基本不太可能雷同,能有效降低页面间的重复性。

2.页面生成后全站多频道给予推荐,以京东为例,一款新上的耳机我可以把它放在电脑外设目录下,也可以同时放在影音产品目录下,这样新页面出来后两个频道都能给予链接。不过这样的解决方案对大网站来言是杯水车薪,理想的解决方案是做个内链推荐系统,最好能和收录查询相结合:例如每周新增10000页面,每个页面至少保证3个内链,一周后查询收录,已收录则撤掉链接支持更新的页面;未收录则果断增加内链,如果加满十个内链也没收录,那就放弃。当然如果你有足够的外链资源适当加几个外链效果自然更佳

内链可以分为几个level :首页 频道 单页,权重由高到低,但数量则是从少到多,如何在分配内链时兼顾数量与质量,头疼呀。。。。

这篇文章未完待续有了好的方法继续来更新

No Comments »

10月
16th 2011
盘点下DJ身份的歌手

Posted under 音乐

   写这篇文章的起因是刚才在看滚石30年台北小巨蛋的演唱会中,李丽芬一首 得意的笑 风采依然,之后去百度了一下她的资料,意外发现她曾经是台湾飞碟电台非常著名的DJ,主持功力也甚是了得。不过她的嗓音条件的确非常出色,女中音尤其稀少啊,数得出的女歌手也就梅艳芳莫文蔚两大天后了。李丽芬作品不多,但爱江山更爱美人和得意的笑 这两首就足以在华语乐坛上写下一笔。

   还有一个DJ出身的华语女歌手也是我本人很喜欢的一位:林忆莲 ,一直猜测她的国语歌发音如此标准,完全听不出是个香港人,或许都是做DJ时打下的基础,她的好歌那是数不胜数了, 夜太黑 伤痕 听说爱情回来过 失踪 前尘 铿锵玫瑰都让我百听不厌

  CRi中国国际广播电台也有一俊男一靓女,男的叫胡昆艺名小飞,他和喻舟搭档了六年之久的飞鱼秀陪伴过度过很多美好的时光,他严格意义上不算歌手吧,据说曾经组过乐队,喜欢John Mayor 和 James Blunt,当然本职DJ工作也是完成的非常出色,幽默感再加上标准的京片子也是让人过耳不忘

  还有一名发过片的女DJ 查可欣 查查,说起来我还是在CCTV6的动感英语节目里面最早认识她,英语水平过人,嗓音也有点靠近女中音,听起来挺温暖的。

  最后能记起来的应该是伍洲彤了,估计他快乐女声评委的形象比DJ更为大家所知,其实他主持的零点乐话也是北京音乐台的招牌栏目,印象中他出过一张专辑里,翻唱了很多齐秦的歌曲,不过就水平而言,这位哥们还是说的比唱的要好啊。。。

No Comments »

09月
18th 2011
百度品牌专区探讨

Posted under 想写就写

百度品牌专区是在网页搜索结果最上方为著名品牌量身定制的资讯发布平台,是为提升网民搜索体验而整合文字、图片、视频等多种展现结果的创新搜索模式,简而言之就是多了种收费的产品。

那是不是所有网站所有品牌都适合做品牌专区呢,我觉得这个问题要分几方面看。。。

1.电商类网站  京东新蛋凡客 其实是可以尝试的,因为电商类网站促销信息多,通过品牌专区的文字和图片能够最大限度地让访客不需要点击页面就知道最近的优惠活动,同时这些优惠对首次访问用户也是很有卖点的信息,如果只有个干巴巴的首页标题描述,相信点击率就会下降不少。

2.分类信息网站 58 赶集百姓网

这类网站做品牌专区有点小亏,因为他们除了团购并没有特别需要提示用户的信息,不过发现58团购和赶集团购果然都做了品牌专区~~~,另外分类信息网站的SEO做的都非常好,再加上他们覆盖城市多,基本上搜各种品牌词都不会旁落,做品牌专区虽然会增加品牌专区的点击,但其实是对品牌词的流量有点小影响的,不过据测算总的流量还是要比投放前多,就是个成本的问题了.一般老板都会认为品牌词本来就是我多年网站营运积累的资产,何必再付钱给百度。

顺便说下,google对网站品牌词保护非常好,其显示的免费sitelink除了没有图片和视频外,几乎可以和百度品牌专区媲美了。

3.品牌客户    奔驰 戴尔 兰蔻

这类客户向来都是财大气粗的主,他们在各种杂志,TVC,户外广告花的钱数不胜数,如果和传统媒体相比,百度品牌专区的ROI还是较高的,另外品牌客户所追求的品牌露出也是百度品牌专区本身的一大卖点,以奔驰为例就能直接显示各型号主推车型的图片及优惠信息,让客户一目了然。另外个人以为这类品牌的受众能上网闲逛的时间有限,如何在短时间内引起受众的注意,品牌专区的确有自己的优势。

不过奔驰这个词的SEO就悲剧了,前几名是汽车之家,百度百科和 爱卡汽车网,官网在第十 二位,而google则是官网排名第一,这也是两个搜索引擎对用户的理解不同吧,老实说百度百科的内容比官网来的还要详尽。。。

No Comments »

08月
23rd 2011
从SEM的角度看SEO

Posted under 想写就写

SEM我没啥研究,但听SEM同事经常说单价,ROI,成本这些关键词,觉得SEM和SEO也有很多共通之处:

一.ROI

很多人都认为SEO是免费流量,免费是不假,但免费流量也不是白白就能拿到的。网站的SEO优化,外部链接建设都需要大量的人力成本和物力成本,做一个SEO项目通常需要产品,研发,测试的大量资源,如果换算成现金也是一笔可观的费用。

另外还有时间成本需要考量,由于SEO项目存在滞后性,一个项目从上线到搜索引擎有反应通常需要月余(特指百度),而一年也就12个月,这时SEO项目的试错成本就相当高,一来一去两个月就过去了。。。因此,规划好项目是SEO的重要工作。

二 .效果监控

这也是我很纠结的一点,SEM这方面比较好,投了多少词,每个词的点击量和价格,都可以跟踪的一清二楚。但SEO做的词我们掌控不了,因为用户啥都会搜。。。 项目评估更加麻烦,很多时候SEO流量的上升是多个项目共同发力的结果,区分单个项目的效果就更加麻烦。目前我也只能看各类型页面的流量分布,在做项目时也以页面为切入口,这样效果可以跟踪得稍微精准一些。

三.质量度

baidu凤巢对关键词有个质量度评分,我觉得这和网站的SEO权重挺像的,质量度高了,可以出低价排名高;权重高也是如此,等于修炼内功,整站权重高了,单个页面的排名自然也会随之提升,使一点劲能起很大作用:}

No Comments »

05月
28th 2011
欧冠回忆

Posted under 想写就写

人老了的标志就是会经常回忆吧,今天又是一年一度的欧冠决赛日,回想起十年前看的欧冠历历在目,十年内发生了多少事啊。。。

02年:皇马vs勒沃库森,齐达内的惊天怒射

03年:AC米兰的舍普琴科一锤定音

04年:波尔图异军突起

05年:利物浦的伊斯坦布尔神话

06年:巴塞罗那逆转,拉尔森和贝莱蒂双双建功

07年:AC米兰和利物浦,君子报仇十年不晚,因扎吉妖刀不老

08年:曼联和切尔西,阿内尔卡一脚射失冠军,C罗趴在地上痛哭流涕的镜头至今难忘

09年:相比决赛,半决赛伊涅斯塔的补时救主更让人惊呼

10年:依旧是半决赛国米封杀巴萨令人唏嘘,穆里尼奥无疑是天下唯一的教练

11年:刚过半场,足球比赛一切皆有可能

十年弹指一挥间,回想这些比赛,自己熬夜看球越来越少,虽然依旧喜爱足球,但生活中毕竟还有其他东西,不再会为足球牺牲一起。工作,感情,家庭有些事情会更加重要,并不是成熟了多少,而是时间的威力。。。

最后一句,依然很想能找到愿意陪我熬夜看球,现场看球的女朋友

No Comments »

04月
16th 2011
【转】以求医为例谈搜索引擎排序算法的基础原理

Posted under 想写就写

注:原文链接:http://stblog.baidu-tech.com/?p=121,这篇文章写得很好,深入浅出,其实里面所说的P(d) 更接近于Trust Rank权重这一说法,整站权重会传递到每个页面,结果就是质量高的网站在搜索引擎上表现更好,差的更差。。。

我们向搜索引擎提交一个查询,搜索引擎会从先到后列出大量的结果,这些结果排序的标准是什么呢?这个看似简单的问题,却是信息检索专家们研究的核心难题之一。

为了说明这个问题,我们来研究一个比搜索引擎更加古老的话题:求医。比如,如果我牙疼,应该去看怎样的医生呢?假设我只有三种选择:

  • A医生,既治眼病,又治胃病;
  • B医生,既治牙病,又治胃病,还治眼病;
  • C医生,专治牙病。

A医生肯定不在考虑之列。B医生和C医生之间,貌视更应该选择C医生,因为他更专注,更适合我的病情。假如再加一个条件:B医生经验丰富,有二十年从医经历,医术高明,而C医生只有五年从医经验,这个问题就不那么容易判断了,是优先选择更加专注的C医生,还是优先选择医术更加高明的B医生,的确成了一个需要仔细权衡的问题。

至少,我们得到了一个结论,择医需要考虑两个条件:医生的专长与病情的适配程度;医生的医术。大家肯定觉得这个结论理所当然,而且可以很自然地联想到,搜索引擎排序不也是这样吗,既要考虑网页内容与用户查询的匹配程度,又要考虑网页本身的质量。但是,怎么把这两种因素结合起来,得到一个,而不是两个或多个排序标准呢?假如我们把这两种因素表示成数值,最终的排序依据是把这两个数值加起来,还是乘起来,或是按决策树的办法把它们组织起来?如果是加起来,是简单相加,还是带权重加呢?

我们可以根据直觉和经验,通过试错的办法,把这两个因素结合起来。但更好的办法是我们能找到一个明确的依据,最好能跟数学这样坚实的学科联系起来。说起来,依据朴素的经验,人类在古代就能建造出高楼;但要建造出高达数百米的 摩天大厦,如果没有建筑力学、材料力学这样坚实的学科作为后盾,则是非常非常困难的。同理,依据朴素的经验构建的搜索引擎算法,用来处理上万的网页集合应该是没问题的;但要检索上亿的网页,则需要更为牢固的理论基础。

求医,病人会优先选择诊断准确、治疗效果好的医生;对于搜索引擎来说,一般按网页满足用户需求的概率从大到小排序。如果用q表示用户给出了一个特定的查询,用d表示一个特定的网页满足了用户的需求,那么排序的依据可以用一个条件概率来表示:

P(d|q)

这个简单的条件概率,将搜索引擎排序算法与概率论这门坚实的学科联系了起来,这就像在大海中航行的船只装备了指南针一样。利用贝叶斯公式,这个条件概率可以表示为:

可以清楚地看到,搜索引擎的排序标准,是由三个部分组成的:查询本身的属性P(q);网页本身的属性P(d);两者的匹配关系P(q|d)。对于同一次查询来说,所有网页对应的P(q)都是一样的,因此排序时可以不考虑,即

公式左边,是已知用户的查询,求网页满足该用户需求的概率。搜索引擎为了提高响应用户查询的性能,需要事先对所有待查询的网页做预处理。预处理时,只知道网页,不知道用户查询,因此需要倒过来计算,即分析每个网页能满足哪些需求,该网页分了多大比例来满足该需求,即得到公式右边的第一项P(q|d),这相当于上文介绍的医生的专门程度。比如,一个网页专门介绍牙病,另一个网页既介绍牙病又介绍胃病,那么对于“牙疼”这个查询来说,前一个网页的P(q|d)值就会更高一些。

公式右边的第二项P(d),是一个网页满足用户需求的概率,它反映了网页本身的好坏,与查询无关。假如要向一个陌生人推荐网页(我们并不知道他需要什么),那么P(d)就相当于某个特定的网页被推荐的概率。在传统的信息检索模型中,这一个量不太被重视,如传统的向量空间模型、BM25模型,都试图只根据查询与文档的匹配关系来得到排序的权重。而实际上,这个与查询无关的量是非常重要的。假如我们用网页被访问的频次来估计它满足用户需求的概率,可以看出对于两个不同的网页,这个量有着极其巨大的差异:有的网页每天只被访问一两次,而有的网页每天被访问成千上万次。能够提供如此巨大差异的量,竟长期被传统的搜索引擎忽略,直到Google发明了pagerank并让它参与到排序中。Pagerank是对P(d)值的一个不错的估计,这个因素的加入使搜索引擎的效果立即上升到了一个新的台阶。

这个公式同样回答了上文提出的问题,网页与查询的匹配程度,和网页本身的好坏,这两个因素应该怎样结合起来参与排序。这个公式以不可辩驳的理由告诉我们,如果网页与查询的匹配程度用P(q|d)来表示,网页本身的好坏用P(d)来表示,那么应该按它们的乘积来进行排序。在现代商业搜索引擎中,需要考虑更多更细节的排序因素,这些因素可能有成百上千个,要把它们融合起来是更加复杂和困难的问题。

No Comments »

Next »