Storm【实践】系列- 我们实践业务的背景

2019-03-02 23:58|来源: 网路

【实践系列介绍】:

       各位看官,本ID描述的【大数据数据实践】系列,目前暂定为三期工程:

      1 期  : Storm 实时大数据处理

      2期   :impala 数据仓库体系建设

      3期  :Spark离线挖掘系统以及Storm数据推荐系统


       此系列博文将持续更新,对更新的频率本ID暂定:

        1 : 如果属于代码阶段,那本ID将保证每日一篇


        2 :如果属于业务梳理阶段,本ID将每星期做一次背景介绍:

                        首先:业务的梳理需要持续的思考,阶段性的思考未必准确,即便贴上博文,价值也不太大。

                        其次:具体的代码实现,将力争每日一篇,如果未有及时跟新,本ID也将及时回补。


  本章内容:

            

                 到目前为止,我们的数据模型为:PhPStat网站浏览统计系统,网址为:

                  http://www.topstat.cn/login.php?ln=demo&lp=demo123


                  点击页面进入

                

                 

请你点击电分析

我们将查看

我们在目前需要做的大概有三个主要的模型

      其一: 访客分析

      其二:订单分析

      其三:商品分析

                       所谓的访客分析就是我们的浏览日志,在浏览日志之中,同样包括了一些商品信息

                        另外的一部分是属于订单信息,订单信息是对于我们订单业务的一种描述。


         在这里我们举个例子说明:  

         订单数据原始格式:

                

指标:订单金额,订单次数,是否付款,付款金额

     

      简单的浏览原始数据格式

 指标:

 


也就是说我们目前的功能,在报表之中,是一个多属性查询的问题? 对于当个维度下的,多个维度下【一般少于三个维度】会进行维度拆分。

 在Storm之中有没有没有更好的办法来处理全属性查询?


转自:http://my.oschina.net/u/1791874/blog/289755

相关问答

更多
  • 实践课要去报名,报了名后,学校会发通知。按通知去培训、实践,结束后发课程合格证。
  • 其实这种东西最好是自己写的 你可以从以下方面下手吧 第一,内部管理不规范。首先,长远物流受日照整个物流管理发展的影响,几处的物流管理差不多都沿袭了旧有的管理模式。部门分工不够明确,制度不健全,少有程序化、规范化的工作流程,大部分进行着简单粗放的的管理。其次,由于物流管理牵扯到的问题众多,各处体制不健全,各种关系错综复杂,需要协调、处理的关系众多,使得各物流处把大量的精力放在处理各种关系上,包括处理物流处与奇瑞汽车之间的关系,物流与行政部门的关系,与有关业主之间的关系。处理好这些关系当然有利与物流管理的发展, ...
  • 我会计是在漳州博胜机构学的,我觉得博胜机构比较好,那里的老师讲的比较详细、比较全面,也能学到公司实账,给你报个电话 6231138
  • 我想已经解决了。 我创建了一个带有标准逻辑的密封业务类,例如我的公司要求我。 它只是一个带有一些逻辑的IRepository包装器。 然后,我创建了一个可继承的业务事务类,它是一个简单的UnotOfWork模式。 该类使用事件参数公开受保护事件,该事件参数需要从某些UI或类似事件加载哪个businessObject,因此从业务事务类继承可以利用此事件来注入其自己的“业务规则”。 BusinessRule是一个简单的接口,其中包含有关“GetDataRequired”和“SavingDataRequired” ...
  • 用正则表达式检查文件名。 使用有关mimetype的信息。 使用md5名称将文件保存在服务器上。 将真实文件名存储在数据库 Check filename with regexp. Use info about mimetype. Save file on server with md5 name. Store real filename on db.
  • 在添加子项之前加载容器(无论如何都是个好主意),这样您就可以利用“set”行为。 将Item添加到容器时,将不会添加它。 哦,你还需要确保在Item中覆盖equals和hashcode,以确保按照你期望的方式工作。 所以... Query query = session.createSQLQuery("FROM Container " + "WHERE name = ? AND owner = ?"); query.setStrin ...
  • 您可以查看Udi Dahan 关于商业活动的帖子 。 那你怎么去消费这样的活动呢? 在Udi Dahan的帖子中,我得到的印象是他只是有一个进程内代理(实际上是一个观察者 ),它会在事件发生时通知所有订阅者。 这种情况无条件地发生,因此每个用户基本上作为自己的过滤器工作,决定它是否想要处理有问题的事件。 只要提升事件本身就发生在进程中,只要代理确保通知异步发生以便订阅者不会相互阻止(或业务触发事件的过程)。 在许多情况下,这可能已经足够好了,但在其他情况下,您可能需要提高可扩展性或稳健性。 这些问题可以通过 ...