public/试题/众望通科技 线上面试题v1.2_20220310.md

58 lines
2.6 KiB
Markdown
Raw Normal View History

2022-03-10 14:09:05 +08:00
## 数据结构:
### 题1词频统计
统计一篇英语文章各单词出现的频率,返回出现频率最高的单词。
### 题2字符串重复统计
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for
example: "ACGAATTCCG". When studying DNA, it is sometimes useful to identify
repeated sequences within the DNA.
Write a function to find all the 10-letter-long sequences (substrings) that occur more
than once in a DNA molecule.
For example, given s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT",
return: ["AAAAACCCCC", "CCCCCAAAAA"].
## 编码设计:(三选二)
### 题3缓存设计
设计一个简单缓存工具类key, value该工具类主要功能有
1、提供基本的读写操作
2、支持设置有效期
3、对已过期失效的缓存进行定期清理
### 题4 :统一社会信用代码
统一社会信用代码是法人和其它组织的唯一性标识,类似自然人的身份证编号。统一社会信用代码由十八位的阿拉伯数字或大写英文字母组成,在法人组织登记成立时,由系统统一进行赋码。需要设计两个功能:
1、赋码功能根据编码规则生成统一社会信用代码
2、校验功能判断一个统一社会信用代码是否合规样例数据`91440000789465832A`
参考资料:[法人和其他组织统一社会信用代码 编码规则](http://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=24691C25985C1073D3A7C85629378AC0)
### 题5
网站数据爬取中,要将网站的图片扒下来,但因网站做了防爬虫,对图片进行了随机片数和顺序的切片打乱处理。请编写一个程序(伪码亦可),将图片重新还原成正确的图片。
处理示例:
<img src="../img/题目5.jpg" style="width:100%"/>
参考思路:
像素点颜色可由RGB0-255,0-255,0-255表示可以将这个RGB值当做为一个在以RGB三个坐标轴的空间直角坐标系中的一个点。那么这个两像素颜色相似的问题就会被转换为空间直角坐标系中两点间的距离问题。利用空间直角坐标系的知识就可以判断其是否相似距离近
可以通过比较像素点的色差,判断两像素点的色差是否在一个合理的阈值内。如果不是,则表明两像素点不连续。当同一行内不连续的点的总数到达某个阈值时,即可将该行判断为断层。反之,在分层后重新排序时,也可根据分片的边缘像素点连续度判断是否应该将分片连接在一起。
数学公式
<img src="../img/题目5-2.png" style="width:100%"/>