首页 \ 问答 \ OCR简介(Introduction to OCR)

OCR简介(Introduction to OCR)

有人给了我一个充满惊人信息的宝库。 这是200MB的扫描公告图像,可以追溯到40年代。 我想对此进行数字化,但我对OCR没有任何认识。 一些早期的材料几乎不可被人读取,更不用说机器了。 这也是希伯来语。

我正在寻找如何解决这个问题的建议。 关于书籍,文章,代码库或软件的一个很好的建议(所有这些应该可以在网上免费获得)。 我精通C ++和Python,如果需要的话,可以选择另一种语言。

谢谢。


Someone gave me a trove full of amazing information. It is 200MB .tiff images of scanned announcements that goes back until the 40's. I want to digitize this, but I have no knowledge whatsoever about OCR. Some of the early material is barely readable by a human, let alone a machine. It is also in Hebrew.

I'm looking for advice on how to approach this. A good suggestion about books, articles, code libraries or software (all of them should be available freely on the web). I'm proficient in C++ and Python and can pick up another language if it is needed.

Thank you.


原文:https://stackoverflow.com/questions/5845033
更新时间:2023-07-13 21:07

最满意答案

如果图例和十字线只需要绘制一次,那么您应该将其放入缓冲区位图。 对于你的图线,可以尝试使用Path对象来绘制线条。 当需要绘制直线时,将drawLine绘制到适当的位置,然后适当地将画布左移。如果


If the legend and the cross hairs only need to be drawn once, then you should place it into a buffer bitmap. For your graph line maybe try using the Path object to plot the lines. When it gets time to draw the lines just drawLine to the appropriate point and then translate the canvas left appropriately.If

相关问答

更多
  • 您可以从数组中删除0条目,因为它们导致图表从最后一点连接到轴: data = [29.9, 71.5, 106.4, 129.2, 144.0]; 然后设置默认的minRange和min这样在初始化时你仍然可以看到轴为12: xAxis: { labels: { style: { fontSize: '13px' } }, min: 0, minRange: 12, }, 然后使用addPoint而不是setData ...
  • 如果图例和十字线只需要绘制一次,那么您应该将其放入缓冲区位图。 对于你的图线,可以尝试使用Path对象来绘制线条。 当需要绘制直线时,将drawLine绘制到适当的位置,然后适当地将画布左移。如果 If the legend and the cross hairs only need to be drawn once, then you should place it into a buffer bitmap. For your graph line maybe try using the Path obj ...
  • 我是建立在d3之上的函数图的作者,幸运的是d3具有在d3-scale中执行映射的方法,所以假设你有一个width x height尺寸的画布应该线性映射到矩形[xMin, yMin] x [xMax, yMax]在2D欧几里德空间你需要创建两个线性尺度 var xScale = d3.scale.linear() .domain([xMin, xMax]) .range([0, width]) var yScale = d3.scale.linear() .domain([yMin, yMax ...
  • 我当时仍然是JS n00b,然后我的代码变得过于膨胀。 一些简单的整合和重新制定确实有所帮助。 但是,现在还有这个JS插件来帮助平滑JS动画: Velocity.js .....对于那些可能在未来降落的人来说,这里有更好的东西: GSAP I was and still am a JS n00b, and my code then was way over-bloated. Some simple consolidation and reformulation really did help. Howeve ...
  • 也许尝试将left与position结合使用:绝对而不是margin-left为你的$slider 。 我想它可能会更快。 Maybe try using left in conjunction with position: absolute instead of margin-left for your $slider. I imagine it might be faster.
  • 首先,我会传递一个const & for the incoming matrices。 你是通过值传递的,如果你有一些draw函数,最终不需要对矩阵做任何特殊的事情,那就是很多不必要的复制。 如果要在矩阵未更改时阻止矩阵计算,则需要使用“脏”标志来确定自上次使用矩阵后的值是否发生了更改。 RenderWare用它的矩阵东西做了类似的事情。 否则,就像在评论中一样,如果没有看到你的整体设计,你所拥有的东西就没有任何本质上的错误。 For one thing, I would pass a const & fo ...
  • 是的,你可以用这个插件(Flot Animator)来做到这一点: http : //www.codicode.com/demo/flotanimator 我开发了这个插件,它可以为任何类型的系列类型(线,条,点)设置动画,您可以选择动画方向(左,右,中),持续时间,步数。 Yes, you can do this with this plugin (Flot Animator) : http://www.codicode.com/demo/flotanimator I developed this plu ...
  • 在javascript中,您可以使用setInterval和setTimeout函数来创建延迟并限制帧速率。 例如,如果你想让你的绘图循环大约30 FPS,你可以有一些看起来像这样的代码: function draw(){ var canvas = document.getElementById('myCanvas'); //create the image object var img = new Image(); //set the im ...
  • 在提出解决方案之前,我需要知道您的期望是什么: 每个动画现在持续2500秒,超过40分钟。 这是你的意图还是应该持续2500ms? 每个动画都从页面顶部开始,使页面底部的边缘非常难看。 这是故意还是圈子应该从页面的随机位置开始? 此外,显示:无法动画。 我为你做了一个FIDDLE来检查。 做出的改变: .animate { -webkit-animation: expand 250s; } @-webkit-keyframes expand { 0% { -webkit-transform ...
  • 动画不会更改,因为您添加和删除了相同的节点。 密切关注: new_edge1 = (edge1[0], edge2[1]) new_edge2 = (edge1[1], edge2[0]) if not(new_edge1 in edges or new_edge2 in edges): G.remove_edge(*edge1) G.remove_edge(*edge2) G.add_edge(new_edge1[0], new_edge2[0]) # equal to (ed ...

相关文章

更多

最新问答

更多
  • 您如何使用git diff文件,并将其应用于同一存储库的副本的本地分支?(How do you take a git diff file, and apply it to a local branch that is a copy of the same repository?)
  • 将长浮点值剪切为2个小数点并复制到字符数组(Cut Long Float Value to 2 decimal points and copy to Character Array)
  • OctoberCMS侧边栏不呈现(OctoberCMS Sidebar not rendering)
  • 页面加载后对象是否有资格进行垃圾回收?(Are objects eligible for garbage collection after the page loads?)
  • codeigniter中的语言不能按预期工作(language in codeigniter doesn' t work as expected)
  • 在计算机拍照在哪里进入
  • 使用cin.get()从c ++中的输入流中丢弃不需要的字符(Using cin.get() to discard unwanted characters from the input stream in c++)
  • No for循环将在for循环中运行。(No for loop will run inside for loop. Testing for primes)
  • 单页应用程序:页面重新加载(Single Page Application: page reload)
  • 在循环中选择具有相似模式的列名称(Selecting Column Name With Similar Pattern in a Loop)
  • System.StackOverflow错误(System.StackOverflow error)
  • KnockoutJS未在嵌套模板上应用beforeRemove和afterAdd(KnockoutJS not applying beforeRemove and afterAdd on nested templates)
  • 散列包括方法和/或嵌套属性(Hash include methods and/or nested attributes)
  • android - 如何避免使用Samsung RFS文件系统延迟/冻结?(android - how to avoid lag/freezes with Samsung RFS filesystem?)
  • TensorFlow:基于索引列表创建新张量(TensorFlow: Create a new tensor based on list of indices)
  • 企业安全培训的各项内容
  • 错误:RPC失败;(error: RPC failed; curl transfer closed with outstanding read data remaining)
  • C#类名中允许哪些字符?(What characters are allowed in C# class name?)
  • NumPy:将int64值存储在np.array中并使用dtype float64并将其转换回整数是否安全?(NumPy: Is it safe to store an int64 value in an np.array with dtype float64 and later convert it back to integer?)
  • 注销后如何隐藏导航portlet?(How to hide navigation portlet after logout?)
  • 将多个行和可变行移动到列(moving multiple and variable rows to columns)
  • 提交表单时忽略基础href,而不使用Javascript(ignore base href when submitting form, without using Javascript)
  • 对setOnInfoWindowClickListener的意图(Intent on setOnInfoWindowClickListener)
  • Angular $资源不会改变方法(Angular $resource doesn't change method)
  • 在Angular 5中不是一个函数(is not a function in Angular 5)
  • 如何配置Composite C1以将.m和桌面作为同一站点提供服务(How to configure Composite C1 to serve .m and desktop as the same site)
  • 不适用:悬停在悬停时:在元素之前[复制](Don't apply :hover when hovering on :before element [duplicate])
  • 常见的python rpc和cli接口(Common python rpc and cli interface)
  • Mysql DB单个字段匹配多个其他字段(Mysql DB single field matching to multiple other fields)
  • 产品页面上的Magento Up出售对齐问题(Magento Up sell alignment issue on the products page)