数据挖掘开源项目立项

项目背景

因为最近一直都在搞数据挖掘类的项目,且现在国内的大数据潮火热。在前几天与群里的几位兄弟聊天所以有了做一个开源项目的想法,以前也搞过一个开源的项目,当时只是想把权限集中化做一下,项目的名称和地址是:

http://www.cnblogs.com/skyme/archive/2012/02/07/2341364.html

但是后期实在工作太忙,就搁置在那里了。

所以现在又搞了一个,目前方向已经大致明确,下边介绍一下思路。

仿今日头条

java+新闻等+仿今日头条+大数据分析和挖掘(分类器+聚类分析+推荐系统等)

经过大家几天的讨论,项目方向已经基本确定!

在github上会发起新项目

这个是讨论的投票结果,结果见下图。

image

系统定位

所有的app都可以接入,不重点做app端,而是做个性化推荐这一块,在服务端。

项目目前的思路如下图所示:

项目架构

目的是提供一个大众化的信息收集系统,让今日头条中所使用的技术不再神秘。

有想参与的可以一起进来讨论

群号 194338168
想深度参与的加,不想参与的就别往里进了,现在需要的主要是开发和文档两类人。群会定期往出清人! (项目会开源出来)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/263651.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WinForm立体饼状图实现(附源码示例) 之配餐系统的开发

本文所要将的是在“配餐系统”开发中 立体饼状图效果的实现,直接贴出代码和附上示例,相信需要的朋友可以很容易使用!项目中的效果图,如下: 实现 应用的是 System.Drawing.PieChart.PieChartControl 控件, PieChartHelp…

计算机注册表管理,学会注册表几个常用的设置,更好地管理自己的电脑!

注册表是Windows操作系统的核心数据库,存放着各种参数,直接控制着Windows的启动、硬件驱动程序的装载以及一些Windows应用程序的运行。从Microsoft Windows 95操作系统开始,注册表成为了Windows用户可以经常接触的内容,并在其后的…

三星自带软件测试手机电池,10图带你领略三星全新电池测试全过程,亡羊补牢?...

原标题:10图带你领略三星全新电池测试全过程,亡羊补牢?在2016年Note 7起火爆炸事件后,三星意识到此前的测试没有注意到电池问题。为此,三星已经改变测试流程,实施八点安全检查制度,包括某些新测…

Android自己主动化測试之Monkeyrunner用法及实例

眼下android SDK里自带的现成的測试工具有monkey 和 monkeyrunner两个。大家别看这俩兄弟名字相像,但事实上是完全然全不同的两个工具,应用在不同的測试领域。总的来说,monkey主要应用在压力和可靠性測试上,执行该命令能够随机地向…

计算机开机b00t设置,电脑boot启动项设置

打开电脑,按下【Delete】键进入BIOS界面,点击【startup(启动)】分别进入【primary Boot Sequence(主要)】、【Automatic Boot Sequence(自动)】和【Error Boot Sequence(错误)】三个页面,通过【】、【-】和【X】键进行项目挑选和排序&#xf…

如何向虚拟机服务器里传文件,怎么往虚拟机复制文件_如何向虚拟机传文件-win7之家...

在工作中,有时在使用虚拟机的时候需要往虚拟机里传文件的,也有遇到传不了文件的情况,一般都是要重新安装VMware tools下就可以了,那么如何向虚拟机传文件呢,方法很简单不难,下面小编给大家分享往虚拟机复制…

指针08 - 零基础入门学习C语言48

第八章:指针08 让编程改变世界 Change the world by program 返回指针值的函数 一个函数可以带回一个整型值、字符值、实型值等,也可以带回指针型的数据,即地址。 其概念与以前类似,只是带回的值的类型是指针类型而已。 这种…

算法中的递归分析和分治法的原理

分析递归算法三种方法替换法、迭代法、通用法(master method)作用:分析递归算法的运行时间分治算法将一个问题分解为与原问题相似但规模更小的若干子问题,递归地解这些子问题,然后将这些子问题的解结合起来构成原问题的…

ps4连接r星服务器稳定,移植到不同平台的《GTA5》有什么变化?与八年前相比,差距这么大...

经历过多次移植的GTA5,这些年都产生了哪些变化呢?当年首次登上PS3平台的GTA5,展现出无数玩家羡慕的精彩时刻,但好景不长,PS4就发布了,而且成功了代替了PS3,成为了GTA5玩家的主力军主机&#xff…

关于pycharm+opencv没有代码提示的问题解决方法记录

代码可以看出实际我们引入的应该是cv2.cv2下面. 所以我们代码只需要import cv2.cv2 as cv 即可. 记着要重新启动下pycharm哦. 可以参考:https://blog.csdn.net/az9996/article/details/90546827 转载于:https://www.cnblogs.com/lovesKey/p/11135185.html

Web前端开发CSS基础(2)

CSS 层叠样式表(英文全称:Cascading Style Sheets),是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言.CSS不仅可以静态地修饰网页,还可以配合各种脚本语言动态地对网页各元素进行格式化,并且能够对网页中元…

消息摘要算法-MAC算法系列

为什么80%的码农都做不了架构师?>>> 一、简述 mac(Message Authentication Code,消息认证码算法)是含有密钥散列函数算法,兼容了MD和SHA算法的特性,并在此基础上加上了密钥。因此MAC算法也经常…

软件开发七宗罪

导读:一起来看看世界各地的程序员们所共有的致命通病,从软件开发的地狱中拯救自己。这七宗罪你有几条? 想成为一名优秀的软件开发人员需要很长时间的培训和实践。但是如果不遵循合适的原则,即便是再好的程序员也会成为失败的牺牲品…

Spring Boot:快速入门教程

什么是Spring Boot? Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置,从而使开发人员不再需要定义样板化的配置。简而言之,Spring Boot通过提供默认配…

移动微技(Mobile Widget)应用开发权威指南

移动微技(Mobile Widget)应用开发权威指南 基本信息 作者: 程宝平 杨晓华 朱春梅 丛书名: 中国移动创新系列丛书 出版社:电子工业出版社 ISBN:9787121104527 上架时间:2010-4-19 出版日…

Apache、Nginx、Tomcat的区别

Apache、Nginx、Tomcat的区别NginxTomcatApache,Nginx与Tomcat的区别Nginx -----是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP代理服务器。** Tomcat -----servlet(jsp)应用服务器 Tomcat是运行在JVM中的一个进程。它定义为“中间件”…

检索

【摘抄】基于线性表的检索一、检索的基本概念和算法分类1、检索概念: 可以形式化地定义基于关键码的检索。假定k1、k2…kn是互不相同的关键码值,有一个包含n条记录的集合C,形式如下: (k1, R1),(k2, R2),…

例说C#深拷贝与浅拷贝

一开始,先对C#深拷贝与浅拷贝知识做个简单的总结。 无论是浅拷贝与深拷贝,C#都将源对象中的所有字段复制到新的对象中。不过,对于值类型字段,引用类型字段以及字符串类型字段的处理,两种拷贝方式存在一定的区别&#x…

企业架构 - 开篇:TOGAF介绍

在《年度总结和计划:去年4个1,今年5个1》中说过今年我准备在项目组引入一个架构方TOGAF。工业和信息化部副部长杨学山在一次内部座谈时提到:与西方发达国家比,国内的信息化建设在硬件方面已经不相上下,在软件方面有5年…

C#(4) implicit explicit

最近几节课学的知识点的量有很大增长,加上上机和托福考试的临近,这里练习的所有代码就不走形式全贴出来了,找我自己觉得又不熟悉的点贴出来,争取简明扼要,恩恩 这次主要看接口的问题: 接口可以多继承&#…