首页 \ 问答 \ Google的疯狂面试题测测你能承受几个？

Google的疯狂面试题测测你能承受几个？

朋友接受了Google公司的面试，他透露了面试中的一些问题。顺便，我把从其他几个曾经面试过的人那里听来的内容也整理在一起。Google的疯狂面试题 测测你能承受几个!

更新时间：2023-01-12 20:01

最满意答案

创建数据

通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。

In [3]: import pandas as pd
In [4]: import random
In [5]: num = random.sample(xrange(10000, 1000000), 5)
In [6]: num
Out[6]: [244937, 132008, 278446, 613409, 799201]
In [8]: names = "hello the cruel world en".split()
In [9]: names
Out[9]: ['hello', 'the', 'cruel', 'world', 'en']
In [10]: rec = zip(names, num)
In [15]: data = pd.DataFrame(rec, columns = [u"姓名",u"业绩" ])
In [16]: data
Out[16]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 

DataFrame方法函数的第一个参数是数据源，第二个参数columns是输出数据表的表头，或者说是表格的字段名。

导出数据csv

Windows平台上的编码问题，我们可以先做个简单处理，是ipython-notebook支持utf8.
import sys
reload(sys)
sys.setdefaultencoding("utf8")

接下来可以数据导出了。
In [31]: data
Out[31]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 
#在ipython-note里后加问号可查帮助，q退出帮助
In [32]: data.to_csv?
In [33]: data.to_csv("c:\\out.csv", index = True, header = [u"雇员", u"销售业绩"])

将data导出到out.csv文件里，index参数是指是否有主索引，header如果不指定则是以data里columns为头，如果指定则是以后边列表里的字符串为表头，但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。

可到c盘用Notepad++打开out.csv看看。

简单的数据分析
In [43]: data
Out[43]:
     姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201
#排序并取前三名
In [46]: Sorted = data.sort([u"业绩"], ascending=False)
         Sorted.head(3)
Out[46]:
     姓名  业绩
4    en      799201
3    world   613409
2    cruel   278446

图形输出
In [71]: import matplotlib.pyplot as plt
         #使ipython-notebook支持matplotlib绘图
         %matplotlib inline
In [74]: df = data
         #绘图
         df[u"业绩"].plot()
         MaxValue = df[u"业绩"].max()
         MaxName = df[u"姓名"][df[u"业绩"] == df[u"业绩"].max()].values
         Text = str(MaxValue) + " - " + MaxName
         #给图添加文本标注
         plt.annotate(Text, xy=(1, MaxValue), xytext=(8, 0), xycoords=('axes fraction', 'data'), textcoords='offset points')

如果注释掉plt.annotate这行

其他回答

创建数据

通过python的zip构造出一元组组成的列表作为dataframe的输入数据rec。

in [3]: import pandas as pd
in [4]: import random
in [5]: num = random.sample(xrange(10000, 1000000), 5)
in [6]: num
out[6]: [244937, 132008, 278446, 613409, 799201]
in [8]: names = "hello the cruel world en".split()
in [9]: names
out[9]: ['hello', 'the', 'cruel', 'world', 'en']
in [10]: rec = zip(names, num)
in [15]: data = pd.dataframe(rec, columns = [u"姓名",u"业绩" ])
in [16]: data
out[16]:
姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 

dataframe方法函数的第一个参数是数据源，第二个参数columns是输出数据表的表头，或者说是表格的字段名。

导出数据csv

windows平台上的编码问题，我们可以先做个简单处理，是ipython-notebook支持utf8.
import sys
reload(sys)
sys.setdefaultencoding("utf8")

接下来可以数据导出了。
in [31]: data
out[31]:
姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201 
#在ipython-note里后加问号可查帮助，q退出帮助
in [32]: data.to_csv?
in [33]: data.to_csv("c:\\out.csv", index = true, header = [u"雇员", u"销售业绩"])

将data导出到out.csv文件里，index参数是指是否有主索引，header如果不指定则是以data里columns为头，如果指定则是以后边列表里的字符串为表头，但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。

可到c盘用notepad++打开out.csv看看。

简单的数据分析
in [43]: data
out[43]:
姓名  业绩
0    hello   244937
1    the     132008
2    cruel   278446
3    world   613409
4    en      799201

Google的疯狂面试题测测你能承受几个？

最满意答案

其他回答

相关问答

python panda怎么提取列数据[2024-03-01]

python panda 统计一列有多少数据[2022-01-25]

Python / Panda - 根据列值向DataFrame添加计数器(Python/Pandas - Add counter to DataFrame based on column values)[2023-12-27]

Python - 用于熊猫数据框中的列的IF(Python - IF for a column in panda dataframe)[2022-08-03]

Python - 有效访问Panda Dataframe的列(Python - Accessing columns of a Panda Dataframe effectively)[2022-03-29]

Python - Panda的数据帧 - 生成具有组级信息的列(Python - Panda's dataframes - generate column with group level information)[2022-07-14]

熊猫数据框日期列中日期格式的转换不一致(Inconsistent conversion of date format in panda dataframe date column)[2022-12-07]

从文本文件中提取多个模式并将其保存到熊猫数据框[python](Extract multiple patterns from a text file and save it to a panda dataframe [python])[2022-06-08]

python panda通过删除重复项来连接动态列(python panda join dynamic columns by removing duplicates)[2021-09-30]

找出python panda数据结构中的副本(Find out which is the duplicate in a python panda data structure)[2022-11-17]

相关文章

最新问答

Google的疯狂面试题 测测你能承受几个？

最满意答案

其他回答

相关问答

python panda怎么提取列数据[2024-03-01]

python panda 统计一列有多少数据[2022-01-25]

Python / Panda - 根据列值向DataFrame添加计数器(Python/Pandas - Add counter to DataFrame based on column values)[2023-12-27]

Python - 用于熊猫数据框中的列的IF(Python - IF for a column in panda dataframe)[2022-08-03]

Python - 有效访问Panda Dataframe的列(Python - Accessing columns of a Panda Dataframe effectively)[2022-03-29]

Python - Panda的数据帧 - 生成具有组级信息的列(Python - Panda's dataframes - generate column with group level information)[2022-07-14]

熊猫数据框日期列中日期格式的转换不一致(Inconsistent conversion of date format in panda dataframe date column)[2022-12-07]

从文本文件中提取多个模式并将其保存到熊猫数据框[python](Extract multiple patterns from a text file and save it to a panda dataframe [python])[2022-06-08]

python panda通过删除重复项来连接动态列(python panda join dynamic columns by removing duplicates)[2021-09-30]

找出python panda数据结构中的副本(Find out which is the duplicate in a python panda data structure)[2022-11-17]

相关文章

最新问答

Google的疯狂面试题测测你能承受几个？