为什么github不出中文版?
据说当年曾经短暂支持过一段时间的国际化多语言版本。后来迅速取消了。
平台做的是内容,内容先出英文的才有利于项目本身的国际化。大多数的流行项目都是英文的,甚至很多国产的开源项目都是英文文档,那么你网站出翻不翻译几个词条有什么影响呢?
- 难不成能不明白Star,Fork,Watch什么意思,非要写收藏,分支,关注才懂?
- 如果不了解Git的pull request什么意思,写成拉取请求人们就能懂了?
提供翻译的几点副作用:
1. 管理复杂,GitHub 的团队只有几十个人(貌似),根本无力把控翻译质量。
2. 客服麻烦,现在所有的客服和帮助文档都是英文,反馈邮件自然也是英文。提供中文版是否会增加客服文档的翻译复杂度?请参考上一条,他们根本无力把控翻译质量。
3. 不同的语言版本其实也是需要改变布局的。幸好中文改变了语言的阅读方向,不然也要归入右侧向左读的语言序列,整个页面布局要做大反转哦。请参考第一条,他们根本无力把控翻译页面的质量。
综上,他们认为提供多语言的害处超过提供多语言的好处。(其实就是懒)
另,程序猿如果读不懂简单的英文文档这行里你怎么混…
感谢兄台斧正在下笔误
事不宜迟,来看看这里面有啥。
从入门到大牛
很多初学者都会遇到这样的问题:入门机器学习应该从哪里学起?
这些过来人表示,学习路径分三步,先学机器学习基础,然后攻克深度学习基础,最后学习自然语言处理(NLP)相关知识。贡献者表示:按照这个流程来学习,你可以当大牛。
在机器学习基础部分,贡献者给出的学习路线图是这样的:
- 机器学习基础
- KNN近邻算法
- 决策树
- 朴素贝叶斯
- 逻辑回归
- SVM支持向量机
- 集成方法
- 回归
- 树回归
- K-Means聚类
- 利用Apriori算法进行关联分析
- FP-growth高效发现频繁项集
- 利用PCA来简化数据
- 利用SVD来简化数据
- 大数据与MapReduce
- 推荐系统
在上面16个学习模块中,是知识点介绍、常用工具和实战项目等不同类型的学习资源的整合版。点进去就是具体学习资料,非常方便。
比如决策树模块,先介绍了概念与主要场景:
然后介绍了具体的项目案例和开发流程代码:
每个模块还有配套视频,一并服用效果更好:
即使以后出现了新的学习资源,这套方法论也可以用上。
深度学习基础部分在第一部分的基础上,继续扩展了反向传播、CNN原理、RNN原理和LSTM四个知识点:
每个知识点对应一个口碑介绍帖,内文图文并茂。
NLP内容的学习路径偏向于实际应用,在文本分类、语言建模、图像字幕、机器翻译、问答系统、语音识别、自动文摘7个领域极少,还一并放上了大量相关数据集: